space ocr
指南文章價格文件
PDF OCR

把文件變成可核對資料的 PDF OCR

用 space-ocr 從 PDF 與掃描檔擷取結構化資料:明細列、內建範本、CSV/JSON 匯出,每個值都連同它在頁面上的位置與比對分數一起回傳。

PDF 是資料藏身的地方。一張發票、一疊收據、一張送貨單——數字明明就在頁面上,但要進到試算表裡通常意味著重新輸入。PDF OCR 承諾解決這件事:讀文件,回傳結構化欄位。問題是,大多數工具止步於一個看似合理的猜測,剩下的就要你自己去信。

space-ocr 回答的是一個更嚴格的問題。它把 PDF 變成結構化的列,並把每個值連同它在頁面上被讀取的確切位置一起回傳——一個看得見的框,加上一個表示比對程度的分數。所以你不必盲信擷取結果,而是可以親自核對。

看一次你可以親自核對的真實擷取

把滑鼠移到下方任一欄位上——收據上的框就是這個值被讀取的位置。這裡的每個數字、框與比對分數,都直接讀自一次真實的解析結果,而不是擺拍。

Receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

每個值都有位置
每個欄位回傳一個邊界框(0–1000 格線上的 xmin/ymin/xmax/ymax)、四個帶方向的頂點與一個 match_ratio——數字可追溯到頁面上的確切位置。
不只是合計,還有明細列
表格以可重複的列回傳,每個儲存格都帶位置,即使一列換行或合併也能追蹤。
內建範本
用一個 templateId 套用收據、發票、送貨單、名片或證件範本——也可以定義你自己的欄位。
乾淨的匯出
帶 UTF-8 BOM 的 CSV(Excel 與中日韓文字安全,明細列展開),以及帶非同步工作與簽章 Webhook 的 REST API JSON。
語言自動辨識
日文、韓文、中文、英文在一個引擎裡——無需設定語言提示,混合文字也能處理。
手機照片也行
載入時套用 EXIF 旋轉,框會跟隨文件的傾斜,所以歪斜的掃描或照片也能對齊。

space-ocr 裡的 PDF OCR 如何運作

把 PDF 拖進應用程式,每一頁都會被算繪成圖片,再被讀取並轉成結構化欄位——一份多頁 PDF 會變成一組可以排序、篩選、匯出的列。如果你直接呼叫 API,請傳送頁面圖片(公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP),回傳的結構化結果是一樣的。

常見文件不必寫 schema。傳一個內建 templateId,例如 receiptinvoice,或定義你自己的 fields——明細列用一個帶 childrenarray 欄位來描述一列。

從頁面圖片擷取欄位
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice-page-1.png",
    "imageType": "url",
    "templateId": "invoice"
  }'

如何對 PDF 做 OCR

  1. 加入你的 PDF
    在應用程式中拖入 PDF——每一頁會被算繪成圖片並排入 OCR 佇列。使用 API 時,把頁面圖片(url 或 base64)傳送到 /ocr/fields。
  2. 選擇範本或欄位
    傳一個內建 templateId,例如 'receipt' 或 'invoice',或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
  3. 讀取結構化結果
    每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳,還有一個定位頁面上每個欄位的 field_bboxes 對應表。
  4. 隨時核對
    點擊儲存格即可高亮它被讀取的確切區域;低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
  5. 匯出或查詢
    下載 CSV(UTF-8 BOM,明細列已展開),或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR,也不額外收費。

簡單、可預期的定價

每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫增加每月掃描數、更多工作表與儲存空間。

Free
$0
  • 100 次掃描/月
  • 3 工作表
  • 1 GB 儲存空間
免費 — 免信用卡
Starter
$19/月
  • 400 次掃描/月
  • 10 工作表
  • 10 GB 儲存空間
免費開始
最受歡迎
Pro
$49/月
  • 1,100 次掃描/月
  • 無限工作表
  • 100 GB 儲存空間
免費開始
我可以用 space-ocr 對 PDF 做 OCR 嗎?
可以。Web 應用直接接受 PDF——它把每一頁算繪成圖片再做 OCR,所以多頁 PDF 會變成結構化的列。公開 API 接收點陣圖像(JPEG、PNG、GIF、BMP、TIFF、WebP),因此呼叫 API 時你傳送頁面圖片。
PDF OCR 會保留每個值的位置嗎?
會。每個擷取出的值都連同一個邊界框(0–1000 正規化格線上的 xmin/ymin/xmax/ymax)、跟隨文件傾斜的四個頂點,以及一個 match_ratio 一起回傳。match_ratio 達到 0.85 以上視為可信比對,1.0 表示每個字元都在頁面上被找到。
它能從 PDF 擷取表格與明細列嗎?
能。把明細列作為 type 為 'array' 的欄位來請求,其 children 描述一列(說明、數量、單價等)。每個儲存格保留自己的邊界框,所以換行或合併的明細列也能追溯到它的位置。
PDF OCR 的結果能匯出成什麼?
帶 UTF-8 BOM 的 CSV(讓 Excel 正確開啟中日韓文字,明細列展開為子列),以及 REST API 的 JSON。你還可以用 GET /view 搭配 where、sort、select 在伺服器端查詢已儲存的工作表——無需重跑 OCR,也不額外收費。
PDF OCR 多少錢?
每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫(Starter 與 Pro)增加每月掃描數、更多工作表與儲存——見上方的方案。
它支援哪些語言?
語言辨識是全自動的——日文、韓文、中文、英文在一個引擎裡,包括混合文字、全形半形與直書文字。你無需設定語言提示。

把你自己的 PDF 變成可核對的資料

免費額度——每月 100 次掃描,免信用卡。每個值都連同它在頁面上的位置一起回傳。

相關