space ocr
ガイド記事料金ドキュメント
PDF OCR

確認できるデータに変える、PDFのOCR

space-ocrでPDFやスキャンから構造化データを抽出。明細行、組み込みテンプレート、CSV/JSONエクスポート、そしてすべての値がページ上の位置とマッチ率とともに返ります。

PDFは、データが隠れてしまう場所です。請求書、領収書の束、納品書——数字はページ上にちゃんとあるのに、表計算に取り込むには結局打ち直すことになります。PDF OCRはそれを解決すると約束します。書類を読んで、構造化されたフィールドを返す、と。ただ問題は、ほとんどのツールがそれらしい推測で止まり、あとはそれを信じるしかないことです。

space-ocrはもっと厳しい問いに答えます。PDFを構造化された行に変え、すべての値を、ページ上のどこから読み取ったかという正確な位置とともに返します——見えるボックスと、どれだけ一致したかのスコア付きで。だから抽出結果を鵜呑みにする必要はなく、自分で確認できます。

その場で確認できる、実際の抽出結果

下のフィールドにマウスを合わせてみてください——領収書上のボックスが、その値を読み取った場所です。ここにある数値・ボックス・マッチ率はすべて、実際の解析結果から読み込んだもので、モックアップではありません。

Receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

すべての値に位置情報
各フィールドはバウンディングボックス(0〜1000グリッド上の xmin/ymin/xmax/ymax)、回転対応の4頂点、match_ratioを返します——数字がページ上の正確な位置まで遡れます。
合計だけでなく明細行も
テーブルはセルごとの位置を持つ繰り返し行として返ります。折り返しや結合された行でも追跡できます。
組み込みテンプレート
領収書・請求書・納品書・名刺・身分証のテンプレートを templateId ひとつで適用。独自フィールドの定義も可能です。
きれいなエクスポート
UTF-8 BOM付きCSV(Excel・CJK対応、明細行は展開)と、非同期ジョブ・署名付きWebhookを備えたREST API経由のJSON。
言語は全自動
日本語・韓国語・中国語・英語をひとつのエンジンで——言語ヒントの設定は不要、混在スクリプトも処理します。
スマホ写真もOK
読み込み時にEXIF回転を適用し、ボックスは書類の傾きに沿います。斜めのスキャンや写真でもきれいに合います。

space-ocrでのPDF OCRの仕組み

アプリにPDFをドロップすると、各ページが画像にレンダリングされ、読み取られて構造化フィールドになります——複数ページのPDFは、並べ替え・絞り込み・エクスポートできる行の集合になります。APIを直接呼ぶ場合は、ページ画像を送ってください(公開APIはラスター画像を受け付けます——JPEG・PNG・GIF・BMP・TIFF・WebP)。返ってくる構造化結果は同じです。

よくある書類なら、スキーマを書く必要はありません。receiptinvoice といった組み込みの templateId を渡すか、独自の fields を定義します——明細行には children を持つ array フィールドを含めます。

ページ画像からフィールドを抽出
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice-page-1.png",
    "imageType": "url",
    "templateId": "invoice"
  }'

PDFをOCRする手順

  1. PDFを追加
    アプリにPDFをドロップすると、各ページが画像にレンダリングされOCR待ち行列に入ります。APIではページ画像(urlまたはbase64)を /ocr/fields に送ります。
  2. テンプレートまたはフィールドを選ぶ
    'receipt' や 'invoice' といった組み込み templateId を渡すか、独自の fields を指定します——明細行テーブルには children を持つ array フィールドを含めます。
  3. 構造化された結果を読む
    各値は bbox・vertices・match_ratio・bbox_source とともに返り、ページ上の全フィールドの位置を示す field_bboxes マップが付きます。
  4. なんでも検証
    セルをクリックすると、それが読み取られた正確な領域がハイライトされます。0.85 を下回る match_ratio は要確認の値です。編集は元のOCR値の隣に保存されます。
  5. エクスポートまたはクエリ
    CSV(UTF-8 BOM、明細行は展開済み)をダウンロードするか、保存済みシートを GET /view で where・sort・select を使ってクエリします——OCR再実行も追加料金もありません。

シンプルで予測できる料金

1枚あたり¥10($0.05 / ₩100)、クレジットカード不要・月100スキャンの無料枠付き。定額プランは月間スキャン数・シート数・ストレージを追加します。

Free
¥0
  • 100 スキャン/月
  • 3 シート
  • 1 GB ストレージ
無料 — カード不要
Starter
¥2,980/月
  • 400 スキャン/月
  • 10 シート
  • 10 GB ストレージ
無料で始める
おすすめ
Pro
¥8,980/月
  • 1,100 スキャン/月
  • シート無制限
  • 100 GB ストレージ
無料で始める
space-ocrでPDFをOCRできますか?
できます。Webアプリは PDF を直接受け付け、各ページを画像にレンダリングしてOCRするため、複数ページのPDFが構造化された行になります。公開APIはラスター画像(JPEG・PNG・GIF・BMP・TIFF・WebP)を受け付けるので、API利用時はページ画像を送ります。
PDF OCRは各値の位置を保持しますか?
はい。抽出された各値は、バウンディングボックス(0〜1000正規化グリッド上の xmin/ymin/xmax/ymax)、書類の傾きに沿った4頂点、match_ratio とともに返ります。match_ratio が 0.85 以上で確実なマッチとみなされ、1.0 はすべての文字がページ上で見つかったことを意味します。
PDFから表や明細行を抽出できますか?
できます。明細行を type が 'array' のフィールドとしてリクエストし、その children で1行(説明・数量・単価など)を記述します。各セルがそれぞれのバウンディングボックスを保持するため、折り返しや結合された明細行でも位置まで追跡できます。
PDF OCRの結果は何にエクスポートできますか?
UTF-8 BOM付きのCSV(ExcelやCJKテキストを正しく開き、明細行はサブ行に展開)と、REST API経由のJSONです。さらに、保存済みシートを GET /view で where・sort・select を使ってサーバー側でクエリできます——OCRの再実行も追加料金もありません。
PDF OCRの料金はいくらですか?
1枚あたり$0.05(¥10 / ₩100)で、クレジットカード不要・月100スキャンの無料枠があります。定額プラン(StarterとPro)は月間スキャン数・シート数・ストレージを追加します——上の料金表をご覧ください。
どの言語に対応していますか?
言語検出は全自動です——日本語・韓国語・中国語・英語をひとつのエンジンで扱い、混在スクリプト、全角・半角、縦書きにも対応します。言語ヒントの設定は不要です。

あなた自身のPDFを、確認できるデータに

無料枠——月100スキャン、クレジットカード不要。すべての値がページ上の位置とともに返ります。

関連