space ocr
指南文章價格文件
OCR API

回傳可驗證資料的 OCR API

一次 REST 呼叫回傳結構化 JSON,每個欄位都帶邊界框、四個頂點與一個比對分數。Bearer 認證、內建範本、非同步工作、簽章 Webhook。

大多數 OCR API 只給你一整頁文字和一個全頁的信賴度數字。你還得自己去找發票合計、解析它、再祈禱它落到了正確的位置。space-ocr 的 OCR API 替你完成結構化:用一張圖片和一個範本做一次 POST,就拿回帶型別的欄位 JSON。

在生產裡真正起作用的,是每個值附帶了什麼。每個欄位都連同它在頁面上被讀取的確切框、那個框的四個角,以及一個比對分數一起回傳。所以你的管線不必信模型的一面之詞,而是可以把每個值和它在文件上的實際位置對照核驗。

一份你可以親自查看的真實回應

把滑鼠移到下方任一欄位上——發票上的框就是這個值被讀取的位置。這是一份真實的解析結果:開立名稱 ソジュハンザン海物語様、應付金額 ¥84,263、合計 ¥46,752、每一條明細列,全都連同各自的框與比對分數回傳。這裡沒有任何東西是擺拍的。

Invoice with extracted-field bounding boxes
Verified fields
Invoice

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

一次呼叫,帶框的 JSON
向 POST /ocr/fields 送一張圖片,拿回帶型別的欄位。每個值都帶 bbox,省去再做一遍「它在哪裡」的查找。
bbox、vertices、match_ratio
每個欄位回傳 0–1000 格線上的 xmin/ymin/xmax/ymax、跟隨頁面傾斜的四個旋轉頂點,以及一個可以設門檻的 match_ratio。
內建範本
只需傳一個 templateId——receipt、invoice、delivery、business_card、driver_license 等。也可以送你自己的 fields(明細列用 array 欄位)。
非同步工作 + 簽章 Webhook
用 POST /upload 把圖片排入佇列,按檔案拿到工作,完成時收到 HMAC-SHA256 簽章的 Webhook——或用 GET /jobs/{jobId} 輪詢。
CSV 與 JSON 匯出
除了 REST 的 JSON,還能把已儲存的工作表匯出為帶 UTF-8 BOM 的 CSV(Excel 與中日韓安全,明細列展開)。
語言自動辨識
日文、韓文、中文、英文在一個引擎裡——無需設定語言提示,混合文字與全形字元也能處理。

space-ocr 裡的 OCR API 如何運作

用 Bearer 權杖認證——你的金鑰以 spocr_ 開頭,基底位址是 https://api.space-ocr.com。把一張點陣圖片以 URL 或 base64 送到 POST /ocr/fields(公開 API 接收圖片——JPEG、PNG、GIF、BMP、TIFF、WebP——所以遇到 PDF 就送頁面圖片)。傳一個內建 templateId 或你自己的 fields,就拿回 { status: 'success', data: {...} },每個欄位都帶值、bbox、vertices 與 match_ratio。

座標不是模型編出來的。LLM 只回傳每個值以及它用到的 word-token id;隨後一個字元比對器把這個值和 Google Vision 在頁面上實際偵測到的符號對齊,並把覆蓋度打成 match_ratio。0.85 以上是可信比對,1.0 表示每個字元都在頁面上被找到。每個回應還帶一個 X-Request-Id 標頭,錯誤以 { error: { code, message, requestId } } 回傳。

從圖片擷取欄位
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice.png",
    "imageType": "url",
    "templateId": "invoice"
  }'
用 Python 做同樣的呼叫
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import os, requests

resp = requests.post(
    "https://api.space-ocr.com/ocr/fields",
    headers={"Authorization": f"Bearer {os.environ['SPACE_OCR_API_KEY']}"},
    json={
        "image": "https://example.com/invoice.png",
        "imageType": "url",
        "templateId": "invoice",
    },
    timeout=60,
)
resp.raise_for_status()
for name, field in resp.json()["data"].items():
    print(name, field["value"], field["bbox"], field["match_ratio"])

如何呼叫 OCR API

  1. 取得 API 金鑰
    登入並建立一個金鑰——它以 spocr_ 開頭。向 https://api.space-ocr.com 的每次請求都以 Authorization: Bearer <key> 傳送。
  2. 傳送圖片
    向 POST /ocr/fields 傳送 image(一個 URL 或純 base64)與 imageType。PDF 請送頁面圖片——API 接收點陣格式(JPEG、PNG、GIF、BMP、TIFF、WebP)。
  3. 選擇範本或欄位
    傳一個內建 templateId,例如 'invoice' 或 'receipt',或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
  4. 讀取結構化結果
    你會拿到 { status: 'success', data: {...} },其中每個值都帶 bbox、vertices、match_ratio 與 bbox_source。對 match_ratio 設門檻,把低於 0.85 的值標出來。
  5. 擴展與查詢
    用 POST /upload 把許多圖片排入佇列(按檔案回傳工作,簽章 Webhook 或 GET /jobs/{jobId}),再用 GET /view 搭配 where、sort、select 讀取已儲存的工作表——無需重跑 OCR,也不額外收費。

簡單、可預期的定價

每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。用 GET /view 重新讀取已儲存的工作表不會重跑 OCR,也不收費。方案計畫增加每月掃描數、更多工作表與儲存空間。

Free
$0
  • 100 次掃描/月
  • 3 工作表
  • 1 GB 儲存空間
免費 — 免信用卡
Starter
$19/月
  • 400 次掃描/月
  • 10 工作表
  • 10 GB 儲存空間
免費開始
最受歡迎
Pro
$49/月
  • 1,100 次掃描/月
  • 無限工作表
  • 100 GB 儲存空間
免費開始
如何對 OCR API 做認證?
每次請求都送一個 HTTP Bearer 權杖——Authorization: Bearer <key>。金鑰以 spocr_ 開頭。基底位址是 https://api.space-ocr.com,沒有版本路徑。缺漏或無效的標頭回傳 401,無法辨識的金鑰回傳 403,每個回應都帶一個用於支援追蹤的 X-Request-Id 標頭。
OCR API 為每個欄位回傳什麼?
一個值、一個邊界框(0–1000 正規化格線上的 xmin/ymin/xmax/ymax,不是像素)、跟隨文件傾斜的四個旋轉頂點、一個 match_ratio 與一個 bbox_source。match_ratio 達到 0.85 以上為可信比對,1.0 表示每個字元都在頁面上被找到。
OCR API 能讀 PDF 嗎?
公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP——所以 PDF 要送頁面圖片。Web 應用直接接受 PDF,把每一頁算繪成圖片再做 OCR。兩種方式的結構化結果一樣。
OCR API 能處理大批量工作嗎?
能。POST /upload 接受一張或多張圖片,按檔案回傳 status 為 'pending' 的工作。完成時以 HMAC-SHA256 簽章的 Webhook(X-Spaceocr-Signature)送達,或用 GET /jobs/{jobId} 輪詢。POST /ocr/fields 對單張圖片保持同步。
有速率限制與錯誤碼嗎?
限制是每個金鑰每分鐘 60 次請求。超過會回傳 429、code 'rate_limited',等待時間在回應主體的 details.retryAfterSec 裡(不是 Retry-After 標頭)。所有錯誤在 400、401、402、404、429、500、502 之間共用信封 { error: { code, message, requestId } }。
OCR API 多少錢?
每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。POST /ocr/fields 與 POST /upload 的每張圖片算一次掃描,GET /space、/view、/amount 不收費。方案計畫(Starter 與 Pro)增加每月掃描數、工作表與儲存——見上方的方案。

做一個回傳可核對資料的 OCR

免費額度——每月 100 次掃描,免信用卡。每個欄位都連同它的框與比對分數一起回傳。

相關