把文件變成可核對資料的 PDF OCR
用 space-ocr 從 PDF 與掃描檔擷取結構化資料:明細列、內建範本、CSV/JSON 匯出,每個值都連同它在頁面上的位置與比對分數一起回傳。
PDF 是資料藏身的地方。一張發票、一疊收據、一張送貨單——數字明明就在頁面上,但要進到試算表裡通常意味著重新輸入。PDF OCR 承諾解決這件事:讀文件,回傳結構化欄位。問題是,大多數工具止步於一個看似合理的猜測,剩下的就要你自己去信。
space-ocr 回答的是一個更嚴格的問題。它把 PDF 變成結構化的列,並把每個值連同它在頁面上被讀取的確切位置一起回傳——一個看得見的框,加上一個表示比對程度的分數。所以你不必盲信擷取結果,而是可以親自核對。
看一次你可以親自核對的真實擷取
把滑鼠移到下方任一欄位上——收據上的框就是這個值被讀取的位置。這裡的每個數字、框與比對分數,都直接讀自一次真實的解析結果,而不是擺拍。

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.
space-ocr 裡的 PDF OCR 如何運作
把 PDF 拖進應用程式,每一頁都會被算繪成圖片,再被讀取並轉成結構化欄位——一份多頁 PDF 會變成一組可以排序、篩選、匯出的列。如果你直接呼叫 API,請傳送頁面圖片(公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP),回傳的結構化結果是一樣的。
常見文件不必寫 schema。傳一個內建 templateId,例如 receipt 或 invoice,或定義你自己的 fields——明細列用一個帶 children 的 array 欄位來描述一列。
curl -s https://api.space-ocr.com/ocr/fields \
-H "Authorization: Bearer $SPACE_OCR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"image": "https://example.com/invoice-page-1.png",
"imageType": "url",
"templateId": "invoice"
}'如何對 PDF 做 OCR
- 加入你的 PDF在應用程式中拖入 PDF——每一頁會被算繪成圖片並排入 OCR 佇列。使用 API 時,把頁面圖片(url 或 base64)傳送到 /ocr/fields。
- 選擇範本或欄位傳一個內建 templateId,例如 'receipt' 或 'invoice',或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
- 讀取結構化結果每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳,還有一個定位頁面上每個欄位的 field_bboxes 對應表。
- 隨時核對點擊儲存格即可高亮它被讀取的確切區域;低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
- 匯出或查詢下載 CSV(UTF-8 BOM,明細列已展開),或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR,也不額外收費。
簡單、可預期的定價
每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫增加每月掃描數、更多工作表與儲存空間。