回傳可驗證資料的 OCR API
一次 REST 呼叫回傳結構化 JSON,每個欄位都帶邊界框、四個頂點與一個比對分數。Bearer 認證、內建範本、非同步工作、簽章 Webhook。
大多數 OCR API 只給你一整頁文字和一個全頁的信賴度數字。你還得自己去找發票合計、解析它、再祈禱它落到了正確的位置。space-ocr 的 OCR API 替你完成結構化:用一張圖片和一個範本做一次 POST,就拿回帶型別的欄位 JSON。
在生產裡真正起作用的,是每個值附帶了什麼。每個欄位都連同它在頁面上被讀取的確切框、那個框的四個角,以及一個比對分數一起回傳。所以你的管線不必信模型的一面之詞,而是可以把每個值和它在文件上的實際位置對照核驗。
一份你可以親自查看的真實回應
把滑鼠移到下方任一欄位上——發票上的框就是這個值被讀取的位置。這是一份真實的解析結果:開立名稱 ソジュハンザン海物語様、應付金額 ¥84,263、合計 ¥46,752、每一條明細列,全都連同各自的框與比對分數回傳。這裡沒有任何東西是擺拍的。

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.
space-ocr 裡的 OCR API 如何運作
用 Bearer 權杖認證——你的金鑰以 spocr_ 開頭,基底位址是 https://api.space-ocr.com。把一張點陣圖片以 URL 或 base64 送到 POST /ocr/fields(公開 API 接收圖片——JPEG、PNG、GIF、BMP、TIFF、WebP——所以遇到 PDF 就送頁面圖片)。傳一個內建 templateId 或你自己的 fields,就拿回 { status: 'success', data: {...} },每個欄位都帶值、bbox、vertices 與 match_ratio。
座標不是模型編出來的。LLM 只回傳每個值以及它用到的 word-token id;隨後一個字元比對器把這個值和 Google Vision 在頁面上實際偵測到的符號對齊,並把覆蓋度打成 match_ratio。0.85 以上是可信比對,1.0 表示每個字元都在頁面上被找到。每個回應還帶一個 X-Request-Id 標頭,錯誤以 { error: { code, message, requestId } } 回傳。
curl -s https://api.space-ocr.com/ocr/fields \
-H "Authorization: Bearer $SPACE_OCR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"image": "https://example.com/invoice.png",
"imageType": "url",
"templateId": "invoice"
}'import os, requests
resp = requests.post(
"https://api.space-ocr.com/ocr/fields",
headers={"Authorization": f"Bearer {os.environ['SPACE_OCR_API_KEY']}"},
json={
"image": "https://example.com/invoice.png",
"imageType": "url",
"templateId": "invoice",
},
timeout=60,
)
resp.raise_for_status()
for name, field in resp.json()["data"].items():
print(name, field["value"], field["bbox"], field["match_ratio"])如何呼叫 OCR API
- 取得 API 金鑰登入並建立一個金鑰——它以 spocr_ 開頭。向 https://api.space-ocr.com 的每次請求都以 Authorization: Bearer <key> 傳送。
- 傳送圖片向 POST /ocr/fields 傳送 image(一個 URL 或純 base64)與 imageType。PDF 請送頁面圖片——API 接收點陣格式(JPEG、PNG、GIF、BMP、TIFF、WebP)。
- 選擇範本或欄位傳一個內建 templateId,例如 'invoice' 或 'receipt',或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
- 讀取結構化結果你會拿到 { status: 'success', data: {...} },其中每個值都帶 bbox、vertices、match_ratio 與 bbox_source。對 match_ratio 設門檻,把低於 0.85 的值標出來。
- 擴展與查詢用 POST /upload 把許多圖片排入佇列(按檔案回傳工作,簽章 Webhook 或 GET /jobs/{jobId}),再用 GET /view 搭配 where、sort、select 讀取已儲存的工作表——無需重跑 OCR,也不額外收費。
簡單、可預期的定價
每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。用 GET /view 重新讀取已儲存的工作表不會重跑 OCR,也不收費。方案計畫增加每月掃描數、更多工作表與儲存空間。