PDF OCR

把文件變成可核對資料的 PDF OCR

用 space-ocr 從 PDF 與掃描檔擷取結構化資料：明細列、內建範本、CSV/JSON 匯出，每個值都連同它在頁面上的位置與比對分數一起回傳。

PDF 是資料藏身的地方。一張發票、一疊收據、一張送貨單——數字明明就在頁面上，但要進到試算表裡通常意味著重新輸入。PDF OCR 承諾解決這件事：讀文件，回傳結構化欄位。問題是，大多數工具止步於一個看似合理的猜測，剩下的就要你自己去信。

space-ocr 回答的是一個更嚴格的問題。它把 PDF 變成結構化的列，並把每個值連同它在頁面上被讀取的確切位置一起回傳——一個看得見的框，加上一個表示比對程度的分數。所以你不必盲信擷取結果，而是可以親自核對。

看一次你可以親自核對的真實擷取

把滑鼠移到下方任一欄位上——收據上的框就是這個值被讀取的位置。這裡的每個數字、框與比對分數，都直接讀自一次真實的解析結果，而不是擺拍。

Receipts with extracted-field bounding boxes

Verified fields

KINSHO · 合計 2,045

ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

每個值都有位置

每個欄位回傳一個邊界框（0–1000 格線上的 xmin/ymin/xmax/ymax）、四個帶方向的頂點與一個 match_ratio——數字可追溯到頁面上的確切位置。

不只是合計，還有明細列

表格以可重複的列回傳，每個儲存格都帶位置，即使一列換行或合併也能追蹤。

內建範本

用一個 templateId 套用收據、發票、送貨單、名片或證件範本——也可以定義你自己的欄位。

乾淨的匯出

帶 UTF-8 BOM 的 CSV（Excel 與中日韓文字安全，明細列展開），以及帶非同步工作與簽章 Webhook 的 REST API JSON。

語言自動辨識

日文、韓文、中文、英文在一個引擎裡——無需設定語言提示，混合文字也能處理。

手機照片也行

載入時套用 EXIF 旋轉，框會跟隨文件的傾斜，所以歪斜的掃描或照片也能對齊。

space-ocr 裡的 PDF OCR 如何運作

把 PDF 拖進應用程式，每一頁都會被算繪成圖片，再被讀取並轉成結構化欄位——一份多頁 PDF 會變成一組可以排序、篩選、匯出的列。如果你直接呼叫 API，請傳送頁面圖片（公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP），回傳的結構化結果是一樣的。

常見文件不必寫 schema。傳一個內建 templateId，例如 receipt 或 invoice，或定義你自己的 fields——明細列用一個帶 children 的 array 欄位來描述一列。

從頁面圖片擷取欄位

curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice-page-1.png",
    "imageType": "url",
    "templateId": "invoice"
  }'

如何對 PDF 做 OCR

加入你的 PDF
在應用程式中拖入 PDF——每一頁會被算繪成圖片並排入 OCR 佇列。使用 API 時，把頁面圖片（url 或 base64）傳送到 /ocr/fields。
選擇範本或欄位
傳一個內建 templateId，例如 'receipt' 或 'invoice'，或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
讀取結構化結果
每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳，還有一個定位頁面上每個欄位的 field_bboxes 對應表。
隨時核對
點擊儲存格即可高亮它被讀取的確切區域；低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
匯出或查詢
下載 CSV（UTF-8 BOM，明細列已展開），或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR，也不額外收費。