space ocr
指南文章價格文件
Invoice OCR

把供應商發票變成可信資料的發票 OCR

別再手動輸入發票。space-ocr 讀出供應商、單號、日期、合計與每一筆明細列,並把每個值連同它在頁面上的位置與比對分數一起回傳。

每一張進到收件匣的發票,都是一筆小小的輸入稅。有人打開 PDF,找出供應商、發票號、日期、稅額列、合計,再把這些全部重新敲進會計系統——要明細的話,還得一列列手抄。又慢,又是錯字的溫床,合計敲錯一個數字就能卡住一次付款。

發票 OCR 本該把這件事接過去:讀發票,回傳欄位。問題在於,大多數工具遞給你一個數字,然後讓你自己去信。space-ocr 把發票讀成結構化的列,並把每個值連同它在頁面上被讀取的確切位置一起回傳——一個看得見的框,加上一個表示比對程度的分數。所以在核准付款之前,你可以核對那個數字,而不是盲信它。

看一張你可以親自核對的真實發票

把滑鼠移到下方任一欄位上——發票上的框就是這個值被讀取的位置。供應商、開立日期、帳單週期、付款期限、應付金額、合計,以及每一筆明細列,都直接讀自一次真實的解析結果,而不是擺拍。

Invoice with extracted-field bounding boxes
Verified fields
Invoice

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

每個值都有位置
供應商、發票號、開立日期、付款期限與每個金額,都連同一個邊界框(0–1000 格線上的 xmin/ymin/xmax/ymax)、四個帶方向的頂點與一個 match_ratio 一起回傳——合計可追溯到頁面上的確切位置。
不只是合計,還有明細列
把明細列作為帶 children 的 array 欄位來請求,描述一列(品名、數量、單價、金額)。每個儲存格都保留自己的框,所以換行或合併的列也能追蹤。
內建發票範本
傳入 templateId 'invoice',常用欄位就已預先定義好——不必寫 schema。版型不同?覆蓋或新增你自己的欄位即可。
稅額與合計
小計、稅額列與總額各自作為獨立欄位回傳,連同千分位分隔符原樣保留,每個值都帶框與分數,入帳前即可核對。
乾淨的匯出
帶 UTF-8 BOM 的 CSV(Excel 與中日韓文字安全,明細列展開為子列),以及 REST API 的 JSON——直接進你的試算表或會計匯入。
AP(應付)自動化
把發票作為非同步工作送到 /upload,每張讀完後收到一個簽章 Webhook,新的供應商發票就會自動流入工作表,不必有人盯著佇列。

space-ocr 裡的發票 OCR 如何運作

把發票拖進應用程式,它會被讀成一列——供應商、日期、金額,明細列則成為一張可以排序、篩選、匯出的子表。PDF 發票會先按頁算繪成圖片,再被讀取。如果你直接呼叫 API,請傳送頁面圖片(公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP),回傳的結構化結果是一樣的。

常見發票不必從頭描述。傳一個內建 templateId invoice,或定義你自己的 fields——明細列用一個帶 childrenarray 欄位來描述一列。

從頁面圖片擷取發票欄位
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice-page-1.png",
    "imageType": "url",
    "templateId": "invoice"
  }'

如何對發票做 OCR

  1. 加入發票
    在應用程式中拖入發票(PDF 或圖片)——每一頁會被算繪成圖片並排入 OCR 佇列。做 AP 自動化時,把它送到 /upload,讀完後收到 Webhook。
  2. 使用發票範本
    供應商、單號、日期、合計用內建 templateId 'invoice',或提供你自己的 fields——明細列用帶 children 的 array 欄位。
  3. 讀取結構化結果
    每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳,還有一個定位發票上每個欄位的 field_bboxes 對應表。
  4. 入帳前先核對
    點擊任一金額即可高亮它被讀取的確切區域;低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
  5. 匯出或查詢
    為會計匯入下載 CSV(UTF-8 BOM,明細列已展開),或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR,也不額外收費。

簡單、可預期的定價

每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫增加每月掃描數、更多工作表與儲存空間。

Free
$0
  • 100 次掃描/月
  • 3 工作表
  • 1 GB 儲存空間
免費 — 免信用卡
Starter
$19/月
  • 400 次掃描/月
  • 10 工作表
  • 10 GB 儲存空間
免費開始
最受歡迎
Pro
$49/月
  • 1,100 次掃描/月
  • 無限工作表
  • 100 GB 儲存空間
免費開始
發票 OCR 能從發票裡取出什麼?
供應商名、發票號、開立日期、付款期限、帳單週期、小計、稅額與總額,各自作為欄位取出,再把明細列作為可重複的列(品名、數量、單價、金額)回傳。每個值都帶頁面上的框與比對分數。
它能讀明細列,而不只是合計嗎?
能。把明細列作為 type 為 'array' 的欄位來請求,其 children 描述一列。每個儲存格保留自己的邊界框,所以換行或合併的明細列也能追溯到位置,匯出時展開為子列。
我怎麼知道它讀出的合計是對的?
每個值都連同一個邊界框(0–1000 格線上的 xmin/ymin/xmax/ymax)、四個帶方向的頂點與一個 match_ratio 回傳。輸出會與頁面上真實的 OCR 符號做核對,0.85 以上為可信比對,1.0 表示每個字元都被找到。點擊儲存格即可高亮它被讀取的確切區域。
我能把發票匯出成 CSV 或匯入會計嗎?
能。下載帶 UTF-8 BOM 的 CSV(讓 Excel 正確開啟中日韓文字,明細列展開為子列),或用 REST API 的 JSON。把發票作為非同步工作送到 /upload,每張讀完後會觸發一個簽章 Webhook。
它支援 PDF 發票嗎?
Web 應用直接接受 PDF 發票——它把每一頁算繪成圖片再做 OCR。公開 API 接收點陣圖像(JPEG、PNG、GIF、BMP、TIFF、WebP),因此呼叫 API 時你傳送頁面圖片。
發票 OCR 多少錢?
每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫(Starter 與 Pro)增加每月掃描數、更多工作表與儲存——見上方的方案。

把你的供應商發票變成可核對的資料

免費額度——每月 100 次掃描,免信用卡。每個值都連同它在頁面上的位置一起回傳。

相關