OCR API

回傳可驗證資料的 OCR API

一次 REST 呼叫回傳結構化 JSON，每個欄位都帶邊界框、四個頂點與一個比對分數。Bearer 認證、內建範本、非同步工作、簽章 Webhook。

大多數 OCR API 只給你一整頁文字和一個全頁的信賴度數字。你還得自己去找發票合計、解析它、再祈禱它落到了正確的位置。space-ocr 的 OCR API 替你完成結構化：用一張圖片和一個範本做一次 POST，就拿回帶型別的欄位 JSON。

在生產裡真正起作用的，是每個值附帶了什麼。每個欄位都連同它在頁面上被讀取的確切框、那個框的四個角，以及一個比對分數一起回傳。所以你的管線不必信模型的一面之詞，而是可以把每個值和它在文件上的實際位置對照核驗。

一份你可以親自查看的真實回應

把滑鼠移到下方任一欄位上——發票上的框就是這個值被讀取的位置。這是一份真實的解析結果：開立名稱 ソジュハンザン海物語様、應付金額 ¥84,263、合計 ¥46,752、每一條明細列，全都連同各自的框與比對分數回傳。這裡沒有任何東西是擺拍的。

Verified fields

Invoice

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

一次呼叫，帶框的 JSON

向 POST /ocr/fields 送一張圖片，拿回帶型別的欄位。每個值都帶 bbox，省去再做一遍「它在哪裡」的查找。

bbox、vertices、match_ratio

每個欄位回傳 0–1000 格線上的 xmin/ymin/xmax/ymax、跟隨頁面傾斜的四個旋轉頂點，以及一個可以設門檻的 match_ratio。

內建範本

只需傳一個 templateId——receipt、invoice、delivery、business_card、driver_license 等。也可以送你自己的 fields（明細列用 array 欄位）。

非同步工作 + 簽章 Webhook

用 POST /upload 把圖片排入佇列，按檔案拿到工作，完成時收到 HMAC-SHA256 簽章的 Webhook——或用 GET /jobs/{jobId} 輪詢。

CSV 與 JSON 匯出

除了 REST 的 JSON，還能把已儲存的工作表匯出為帶 UTF-8 BOM 的 CSV（Excel 與中日韓安全，明細列展開）。

語言自動辨識

日文、韓文、中文、英文在一個引擎裡——無需設定語言提示，混合文字與全形字元也能處理。

space-ocr 裡的 OCR API 如何運作

用 Bearer 權杖認證——你的金鑰以 spocr_ 開頭，基底位址是 https://api.space-ocr.com。把一張點陣圖片以 URL 或 base64 送到 POST /ocr/fields（公開 API 接收圖片——JPEG、PNG、GIF、BMP、TIFF、WebP——所以遇到 PDF 就送頁面圖片）。傳一個內建 templateId 或你自己的 fields，就拿回 { status: 'success', data: {...} }，每個欄位都帶值、bbox、vertices 與 match_ratio。

座標不是模型編出來的。LLM 只回傳每個值以及它用到的 word-token id；隨後一個字元比對器把這個值和 Google Vision 在頁面上實際偵測到的符號對齊，並把覆蓋度打成 match_ratio。0.85 以上是可信比對，1.0 表示每個字元都在頁面上被找到。每個回應還帶一個 X-Request-Id 標頭，錯誤以 { error: { code, message, requestId } } 回傳。

從圖片擷取欄位

curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice.png",
    "imageType": "url",
    "templateId": "invoice"
  }'

用 Python 做同樣的呼叫

import os, requests

resp = requests.post(
    "https://api.space-ocr.com/ocr/fields",
    headers={"Authorization": f"Bearer {os.environ['SPACE_OCR_API_KEY']}"},
    json={
        "image": "https://example.com/invoice.png",
        "imageType": "url",
        "templateId": "invoice",
    },
    timeout=60,
)
resp.raise_for_status()
for name, field in resp.json()["data"].items():
    print(name, field["value"], field["bbox"], field["match_ratio"])

如何呼叫 OCR API

取得 API 金鑰
登入並建立一個金鑰——它以 spocr_ 開頭。向 https://api.space-ocr.com 的每次請求都以 Authorization: Bearer <key> 傳送。
傳送圖片
向 POST /ocr/fields 傳送 image（一個 URL 或純 base64）與 imageType。PDF 請送頁面圖片——API 接收點陣格式（JPEG、PNG、GIF、BMP、TIFF、WebP）。
選擇範本或欄位
傳一個內建 templateId，例如 'invoice' 或 'receipt'，或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
讀取結構化結果
你會拿到 { status: 'success', data: {...} }，其中每個值都帶 bbox、vertices、match_ratio 與 bbox_source。對 match_ratio 設門檻，把低於 0.85 的值標出來。
擴展與查詢
用 POST /upload 把許多圖片排入佇列（按檔案回傳工作，簽章 Webhook 或 GET /jobs/{jobId}），再用 GET /view 搭配 where、sort、select 讀取已儲存的工作表——無需重跑 OCR，也不額外收費。

簡單、可預期的定價

每張圖片 $0.05（¥10 / ₩100），含每月 100 次掃描的免費額度，免信用卡。用 GET /view 重新讀取已儲存的工作表不會重跑 OCR，也不收費。方案計畫增加每月掃描數、更多工作表與儲存空間。

Free

100 次掃描/月
3 工作表
1 GB 儲存空間

免費 — 免信用卡

Starter

$19/月

400 次掃描/月
10 工作表
10 GB 儲存空間

免費開始

最受歡迎

Pro

$49/月

1,100 次掃描/月
無限工作表
100 GB 儲存空間

免費開始

如何對 OCR API 做認證？

每次請求都送一個 HTTP Bearer 權杖——Authorization: Bearer <key>。金鑰以 spocr_ 開頭。基底位址是 https://api.space-ocr.com，沒有版本路徑。缺漏或無效的標頭回傳 401，無法辨識的金鑰回傳 403，每個回應都帶一個用於支援追蹤的 X-Request-Id 標頭。

OCR API 為每個欄位回傳什麼？

一個值、一個邊界框（0–1000 正規化格線上的 xmin/ymin/xmax/ymax，不是像素）、跟隨文件傾斜的四個旋轉頂點、一個 match_ratio 與一個 bbox_source。match_ratio 達到 0.85 以上為可信比對，1.0 表示每個字元都在頁面上被找到。

OCR API 能讀 PDF 嗎？

公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP——所以 PDF 要送頁面圖片。Web 應用直接接受 PDF，把每一頁算繪成圖片再做 OCR。兩種方式的結構化結果一樣。

OCR API 能處理大批量工作嗎？

能。POST /upload 接受一張或多張圖片，按檔案回傳 status 為 'pending' 的工作。完成時以 HMAC-SHA256 簽章的 Webhook（X-Spaceocr-Signature）送達，或用 GET /jobs/{jobId} 輪詢。POST /ocr/fields 對單張圖片保持同步。

有速率限制與錯誤碼嗎？

限制是每個金鑰每分鐘 60 次請求。超過會回傳 429、code 'rate_limited'，等待時間在回應主體的 details.retryAfterSec 裡（不是 Retry-After 標頭）。所有錯誤在 400、401、402、404、429、500、502 之間共用信封 { error: { code, message, requestId } }。

OCR API 多少錢？

每張圖片 $0.05（¥10 / ₩100），含每月 100 次掃描的免費額度，免信用卡。POST /ocr/fields 與 POST /upload 的每張圖片算一次掃描，GET /space、/view、/amount 不收費。方案計畫（Starter 與 Pro）增加每月掃描數、工作表與儲存——見上方的方案。

做一個回傳可核對資料的 OCR

免費額度——每月 100 次掃描，免信用卡。每個欄位都連同它的框與比對分數一起回傳。

取得 API 金鑰 API 文件

相關

發票資料擷取 API：開發者完整指南

帶定界框的 OCR API：驗證每一個值（2026）

OCR API with Source Coordinates: Verify Every Value (2026)