スキャンしたレシートをGoogleスプレッドシートにインポートする方法
山積みのレシートをスキャンして、きれいなGoogleスプレッドシートに変換。データを抽出し、BOM付きCSVでエクスポートすれば、ワンクリックでインポート完了。すべての値は元画像と照合して検証できます。
経費精算や帳簿付けのたびに溜まっていくレシートの山。その処理方法はいつも同じ。ベンダー名、日付、合計金額をひたすら手で入力し、打ち間違えがないか確認しながら次の行へ。この退屈な作業をなくし、スキャン画像から直接Googleスプレッドシートのきれいなデータ行に変換する方法があります。
実際のレシートでどのように機能するか、何もアップロードせずに以下でお試しください。

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

手順はシンプルです。まず、レシートに必要な列(Vendor、Date、Totalなど)を定義します。これにより、space-ocr内に構造化されたシートが作成されます。次に、スキャンした画像(JPEG、PNGなど)をアップロードするだけ。サービスが各画像を処理し、抽出したデータを新しい行として正しい列に配置します。
準備ができたら、コレクション全体を1つのCSVファイルとしてエクスポートします。
これは複雑な連携機能ではありません。Googleスプレッドシートが完全に理解できる、クリーンで標準的なCSVファイルです。ファイルはUTF-8 BOMでエンコードされているため、デモのレシートにある店舗名「ライフ」のような日本語の文字も問題なくインポートできます。Googleスプレッドシートの組み込み機能 ファイル > インポート を使うだけです。
他と違うのは、監査証跡(オーディットトレイル)です。単なるテキスト値のリストではなく、ページ上のどこからその情報が来たのか、ソースと恒久的に結びついたデータを取得できます。
すべての値が事実に基づいていることを保証するため、space-ocrは言語モデルからの出力をドキュメントのソースと照合します。LLMはテキスト値とともに、どの単語を使用したかのヒントを返します。次にエンジンは、その値をページ上で検出された実際のOCRシンボルと文字単位で照合します。
このプロセスにより、各フィールドの信頼度スコア(match_ratio)が生成されます。0.85以上のスコアは、信頼性の高い一致を示します。結果として、データがどこで見つかったかを正確に示す、0-1000で正規化された座標(xmin, ymin, xmax, ymax)を持つバウンディングボックスが得られます。
料金体系は明快です。正常に処理された画像1枚につき¥10がかかります。何らかの理由でドキュメントの処理に失敗した場合、料金は発生しません。毎月最初の100枚は無料で、利用開始にあたってクレジットカードの登録は不要です。
- space-ocrでシートを作成ベンダー、日付、合計など、データに必要な列を定義します。
- スキャン画像をアップロードJPEG、PNGなどのレシート画像を新しいシートにドラッグ&ドロップします。
- 確認と検証抽出されたデータを確認します。セルをクリックすると、元のスキャン画像のどこから抽出されたかを確認できます。
- CSVにエクスポートシートメニューから、抽出されたすべての行を単一のCSVファイルとしてダウンロードします。
- Googleスプレッドシートにインポート新規または既存のGoogleスプレッドシートで、「ファイル > インポート」を選択し、ダウンロードしたCSVファイルをアップロードします。