テキストの羅列ではなく、構造化フィールドを返す画像OCR
space-ocrでJPEGやPNGなどの画像をOCR。組み込みテンプレート、明細行、CSV/JSONエクスポート、そしてすべての値がページ上のボックスとマッチ率とともに返ります。
ほとんどの画像OCRは、ベタなテキストの塊を返してそこで終わりです。領収書を撮って読み込ませても、返ってくるのは行の集まりで、結局それを読んで、区切って、正しい列に打ち直すことになります。ページを見れば一目でわかったはずの構造が、消えてしまうのです。
space-ocrは画像を構造化フィールドとして読み取ります——店名はここ、日付はそこ、合計はあそこ、明細は行として。そしてすべての値を、画像のどこから読み取ったかという正確な位置とともに返します。見えるボックスと、ピクセルにどれだけ一致したかのスコア付きで。だから抽出結果を信じるしかない、ということはありません。写真を見て、自分で確認できます。
その場で確認できる、実際の抽出結果
これは1枚の画像——領収書2枚を写した写真——をフィールドに読み取ったものです。下の値にマウスを合わせると、画像上のボックスがその値を読み取った場所です。ここにある数値・ボックス・マッチ率はすべて、実際の解析結果から読み込んだもので、モックアップではありません。

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.
space-ocrでの画像OCRの仕組み
画像をURLまたは純粋なbase64として /ocr/fields に送ります——JPEG・PNG・GIF・BMP・TIFF・WebPはそのまま読み取られます。読み込み時にEXIF orientationを適用するので、返ってくるボックスは表示される写真と一致します。スマホを斜めに構えて撮った写真でも同じです。
よくある書類なら、スキーマを書く必要はありません。receipt や invoice といった組み込みの templateId を渡すか、独自の fields を定義します——明細行には children を持つ array フィールドを含めます。(PDFはWebアプリ経由で、各ページをまず画像にレンダリングします。API自体は画像を読みます。)
curl -s https://api.space-ocr.com/ocr/fields \
-H "Authorization: Bearer $SPACE_OCR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"image": "https://example.com/receipt-photo.jpg",
"imageType": "url",
"templateId": "receipt"
}'画像をOCRする手順
- 画像を送るJPEG・PNG・GIF・BMP・TIFF・WebPを /ocr/fields にURLまたは純粋なbase64で送るか、アプリにドロップします。読み込み時にEXIF回転が適用されます。
- テンプレートまたはフィールドを選ぶ'receipt' や 'invoice' といった組み込み templateId を渡すか、独自の fields を指定します——明細行テーブルには children を持つ array フィールドを含めます。
- 構造化された結果を読む各値は bbox・vertices・match_ratio・bbox_source とともに返り、画像上の全フィールドの位置を示す field_bboxes マップが付きます。
- なんでも検証値をクリックすると、それが読み取られた正確な領域がハイライトされます。0.85 を下回る match_ratio は要確認の値です。編集は元のOCR値の隣に保存されます。
- エクスポートまたはクエリCSV(UTF-8 BOM、明細行は展開済み)をダウンロードするか、保存済みシートを GET /view で where・sort・select を使ってクエリします——OCR再実行も追加料金もありません。
シンプルで予測できる料金
1枚あたり¥10($0.05 / ₩100)、クレジットカード不要・月100スキャンの無料枠付き。定額プランは月間スキャン数・シート数・ストレージを追加します。