画像内の表データをCSVに抽出する方法
表、注文書、納品書の写真から、クリーンなCSVファイルを作成します。space-ocrがどのように明細行を処理し、各行を正確に抽出するかを解説します。
スキャンした納品書や注文書の表データを、スプレッドシートに入力するのは骨の折れる作業です。鮮明な画像があっても、結局はピクセルデータに過ぎません。多くの場合、項目、数量、価格などを一行ずつ手でコピー&ペーストする地道な作業が待っています。このプロセスは時間がかかるだけでなく、たった一つの入力ミスがデータセット全体を狂わせてしまう原因にもなります。

より良いアプローチは、表の構造をテンプレートとして扱うことです。単にテキストブロックを抜き出すのではなく、必要な列を定義します。例えば、繰り返し現れる明細行のセクションは、商品名、単価、数量といった子要素を持つ配列として定義します。画像をアップロードすると、space-ocrはこの構造に従って処理を行い、画像内の各行を構造化されたデータに変換します。
この方法は、値が密集した表でも有効です。システムはまず大規模言語モデルを使って抽出テキストの候補を生成しますが、処理はそこで終わりません。例えば「株式会社山治」という会社名や「580」という単価など、個々の値に対してクロス検証を行います。言語モデルの提案を文書の列構造と照合し、ページ上で元々検出されたOCRシンボルと文字単位でマッチングさせます。この検証ステップにより、データが隣接する行にずれてしまうのを防ぎます。
抽出されたすべての値は、元の画像と照合して検証されます。AIが提案したテキストは、ページ上で検出された実際のOCRシンボルと文字単位でマッチングさせることでチェックされます。このプロセスにより、信頼度スコアであるmatch_ratioが生成されます。スコアが0.85以上であれば、信頼性の高い一致と判断できます。各値のバウンディングボックス座標は、このマッチングしたシンボルから導出され、0から1000のスケールで正規化されるため、すべてのデータに対して検証可能な監査証跡を提供します。
料金は従量課金制で、画像処理1枚あたり¥10です。毎月100枚分の無料スキャン枠がアカウントに付与されます。何らかの理由で抽出に失敗した場合は、料金は一切かかりません。
- シートスキーマを定義する新しいシートを作成し、列を定義します。明細行には「配列」タイプを使用し、商品名、数量、価格などの子列を追加します。
- 画像をアップロードするドラッグ&ドロップまたはAPIを使用して、表が写った画像をシートにアップロードします。
- 抽出データを確認する画像がスキーマに沿って処理されます。表の各明細行が、シート上で構造化された行として表示されます。
- 必要に応じて修正する任意のセルをクリックすると、画像上の対応する領域が表示されます。グリッド上で直接、値を手動で修正できます。
- CSVにエクスポートする「エクスポート」ボタンをクリックし、CSVを選択します。すべての明細行を含む表データが、クリーンで構造化されたファイルとしてダウンロードされます。