space ocr
ガイド記事料金ドキュメント
Image OCR

テキストの羅列ではなく、構造化フィールドを返す画像OCR

space-ocrでJPEGやPNGなどの画像をOCR。組み込みテンプレート、明細行、CSV/JSONエクスポート、そしてすべての値がページ上のボックスとマッチ率とともに返ります。

ほとんどの画像OCRは、ベタなテキストの塊を返してそこで終わりです。領収書を撮って読み込ませても、返ってくるのは行の集まりで、結局それを読んで、区切って、正しい列に打ち直すことになります。ページを見れば一目でわかったはずの構造が、消えてしまうのです。

space-ocrは画像を構造化フィールドとして読み取ります——店名はここ、日付はそこ、合計はあそこ、明細は行として。そしてすべての値を、画像のどこから読み取ったかという正確な位置とともに返します。見えるボックスと、ピクセルにどれだけ一致したかのスコア付きで。だから抽出結果を信じるしかない、ということはありません。写真を見て、自分で確認できます。

その場で確認できる、実際の抽出結果

これは1枚の画像——領収書2枚を写した写真——をフィールドに読み取ったものです。下の値にマウスを合わせると、画像上のボックスがその値を読み取った場所です。ここにある数値・ボックス・マッチ率はすべて、実際の解析結果から読み込んだもので、モックアップではありません。

Receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

テキストの羅列ではなく構造化フィールド
画像は、店名・日付・合計・明細行といった名前付きフィールドと行になって返ります——自分で区切る必要のある長い1本の文字列ではありません。
すべての値に位置情報
各フィールドはバウンディングボックス(0〜1000グリッド上の xmin/ymin/xmax/ymax)、回転対応の4頂点、match_ratioを返します——値が画像上の正確な位置まで遡れます。
スマホ写真もOK
読み込み時にEXIF回転を適用するので、返る座標は表示中の画像と一致します。回転対応のボックスは、手持ち撮影の傾きにも沿います。
組み込みテンプレート
領収書・請求書・納品書・名刺・運転免許証のテンプレートを templateId ひとつで適用。独自フィールドの定義も可能です。
合計だけでなく明細行も
テーブルはセルごとの位置を持つ繰り返し行として返ります。文字の詰まった画像で行が折り返しや結合をしても追跡できます。
きれいなエクスポート
UTF-8 BOM付きCSV(Excel・CJK対応、明細行は展開)と、非同期ジョブ・署名付きWebhookを備えたREST API経由のJSON。

space-ocrでの画像OCRの仕組み

画像をURLまたは純粋なbase64として /ocr/fields に送ります——JPEG・PNG・GIF・BMP・TIFF・WebPはそのまま読み取られます。読み込み時にEXIF orientationを適用するので、返ってくるボックスは表示される写真と一致します。スマホを斜めに構えて撮った写真でも同じです。

よくある書類なら、スキーマを書く必要はありません。receiptinvoice といった組み込みの templateId を渡すか、独自の fields を定義します——明細行には children を持つ array フィールドを含めます。(PDFはWebアプリ経由で、各ページをまず画像にレンダリングします。API自体は画像を読みます。)

画像からフィールドを抽出
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/receipt-photo.jpg",
    "imageType": "url",
    "templateId": "receipt"
  }'

画像をOCRする手順

  1. 画像を送る
    JPEG・PNG・GIF・BMP・TIFF・WebPを /ocr/fields にURLまたは純粋なbase64で送るか、アプリにドロップします。読み込み時にEXIF回転が適用されます。
  2. テンプレートまたはフィールドを選ぶ
    'receipt' や 'invoice' といった組み込み templateId を渡すか、独自の fields を指定します——明細行テーブルには children を持つ array フィールドを含めます。
  3. 構造化された結果を読む
    各値は bbox・vertices・match_ratio・bbox_source とともに返り、画像上の全フィールドの位置を示す field_bboxes マップが付きます。
  4. なんでも検証
    値をクリックすると、それが読み取られた正確な領域がハイライトされます。0.85 を下回る match_ratio は要確認の値です。編集は元のOCR値の隣に保存されます。
  5. エクスポートまたはクエリ
    CSV(UTF-8 BOM、明細行は展開済み)をダウンロードするか、保存済みシートを GET /view で where・sort・select を使ってクエリします——OCR再実行も追加料金もありません。

シンプルで予測できる料金

1枚あたり¥10($0.05 / ₩100)、クレジットカード不要・月100スキャンの無料枠付き。定額プランは月間スキャン数・シート数・ストレージを追加します。

Free
¥0
  • 100 スキャン/月
  • 3 シート
  • 1 GB ストレージ
無料 — カード不要
Starter
¥2,980/月
  • 400 スキャン/月
  • 10 シート
  • 10 GB ストレージ
無料で始める
おすすめ
Pro
¥8,980/月
  • 1,100 スキャン/月
  • シート無制限
  • 100 GB ストレージ
無料で始める
space-ocrはどの画像フォーマットをOCRできますか?
公開APIはラスター画像をそのまま読み取ります——JPEG・PNG・GIF・BMP・TIFF・WebP。画像は自動でRGBに変換されます。PDFはWebアプリ経由で、各ページを画像にレンダリングしてからOCRします。
画像OCRは構造化フィールドを返しますか、それとも単なるテキストですか?
構造化フィールドです。画像は店名・日付・合計・明細行といった名前付きの値と行に読み取られ、それぞれが位置情報を持ちます——自分で解析しなければならない長いテキストの塊ではありません。
スマホで撮った写真をOCRできますか?
できます。読み込み時にEXIF orientationを適用するので、返る座標は表示中の写真と一致し、回転対応のバウンディングボックスは手持ち撮影の傾きに沿います。少し斜めの写真でもきれいに合います。
画像OCRは各値の位置を保持しますか?
はい。各値は、バウンディングボックス(0〜1000正規化グリッド上の xmin/ymin/xmax/ymax)、回転対応の4頂点、match_ratio とともに返ります。match_ratio が 0.85 以上で確実なマッチとみなされ、1.0 はすべての文字が画像上で見つかったことを意味します。
画像はどうやってAPIに送りますか?
POST /ocr/fields にURL(imageType 'url')または純粋なbase64(imageType 'base64'、data-URIプレフィックスなし)として送ります。認証はBearerトークンで、キーは spocr_ で始まります。組み込み templateId か独自の fields を渡します。
画像OCRの料金はいくらですか?
1枚あたり$0.05(¥10 / ₩100)で、クレジットカード不要・月100スキャンの無料枠があります。定額プラン(StarterとPro)は月間スキャン数・シート数・ストレージを追加します——上の料金表をご覧ください。

あなた自身の画像を、確認できるデータに

無料枠——月100スキャン、クレジットカード不要。すべての値が画像上の位置とともに返ります。

関連