space ocr
指南文章價格文件
Image OCR

回傳結構化欄位而不是一堆文字的圖像 OCR

用 space-ocr 對 JPEG、PNG 等圖像做 OCR:內建範本、明細列、CSV/JSON 匯出,每個值都連同它在圖像上的框與比對分數一起回傳。

大多數圖像 OCR只是丟給你一堆純文字,然後就沒了。你拍一張收據,跑一遍,回來的是一團列,你還得自己去讀、去拆、再輸入到對應的欄裡。原本在頁面上一眼就能看清的結構,沒了。

space-ocr 把圖像讀成結構化欄位——店名在這、日期在那、合計在那邊、明細是一列列的。並且把每個值連同它在圖像上被讀取的確切位置一起回傳:一個看得見的框,加上一個表示它與像素比對程度的分數。所以你不必盲信擷取結果,而是可以看著照片親自核對。

看一次你可以親自核對的真實擷取

這是一張圖像——拍了兩張收據的照片——被讀成了欄位。把滑鼠移到下方任一值上,圖像上的框就是這個值被讀取的位置。這裡的每個數字、框與比對分數,都直接讀自一次真實的解析結果,而不是擺拍。

Receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

結構化欄位,不是一堆文字
圖像會變成帶名字的欄位與列——店名、日期、合計、明細列——可以直接進試算表,而不是一串你得自己去拆的長字串。
每個值都有位置
每個欄位回傳一個邊界框(0–1000 格線上的 xmin/ymin/xmax/ymax)、四個帶方向的頂點與一個 match_ratio——值可追溯到圖像上的確切位置。
手機照片也行
載入時套用 EXIF 旋轉,所以回傳的座標與你看到的圖像對齊;帶方向的框也會跟隨手持拍攝的傾斜。
內建範本
用一個 templateId 套用收據、發票、送貨單、名片或駕照範本——也可以定義你自己的欄位。
不只是合計,還有明細列
表格以可重複的列回傳,每個儲存格都帶位置,即使在擁擠的圖像上一列換行或合併也能追蹤。
乾淨的匯出
帶 UTF-8 BOM 的 CSV(Excel 與中日韓文字安全,明細列展開),以及帶非同步工作與簽章 Webhook 的 REST API JSON。

space-ocr 裡的圖像 OCR 如何運作

把圖像以 URL 或純 base64 傳送到 /ocr/fields——JPEG、PNG、GIF、BMP、TIFF、WebP 都會被直接讀取。載入時套用 EXIF orientation,所以回傳的框與顯示出來的照片對齊,就算是斜著拿手機拍的也一樣。

常見文件不必寫 schema。傳一個內建 templateId,例如 receiptinvoice,或定義你自己的 fields——明細列用一個帶 childrenarray 欄位來描述一列。(PDF 走 Web 應用,先把每一頁算繪成圖片;API 本身讀的是圖像。)

從圖像擷取欄位
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/receipt-photo.jpg",
    "imageType": "url",
    "templateId": "receipt"
  }'

如何對圖像做 OCR

  1. 傳送你的圖像
    把 JPEG、PNG、GIF、BMP、TIFF 或 WebP 以 URL 或純 base64 傳送到 /ocr/fields,或拖進應用程式。載入時會套用 EXIF 旋轉。
  2. 選擇範本或欄位
    傳一個內建 templateId,例如 'receipt' 或 'invoice',或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
  3. 讀取結構化結果
    每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳,還有一個定位圖像上每個欄位的 field_bboxes 對應表。
  4. 隨時核對
    點擊一個值即可高亮它被讀取的確切區域;低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
  5. 匯出或查詢
    下載 CSV(UTF-8 BOM,明細列已展開),或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR,也不額外收費。

簡單、可預期的定價

每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫增加每月掃描數、更多工作表與儲存空間。

Free
$0
  • 100 次掃描/月
  • 3 工作表
  • 1 GB 儲存空間
免費 — 免信用卡
Starter
$19/月
  • 400 次掃描/月
  • 10 工作表
  • 10 GB 儲存空間
免費開始
最受歡迎
Pro
$49/月
  • 1,100 次掃描/月
  • 無限工作表
  • 100 GB 儲存空間
免費開始
space-ocr 能對哪些圖像格式做 OCR?
公開 API 直接讀取點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP。圖像會被自動轉成 RGB。PDF 走 Web 應用,先把每一頁算繪成圖片再做 OCR。
圖像 OCR 給我的是結構化欄位還是純文字?
結構化欄位。圖像被讀成帶名字的值與列——店名、日期、合計、明細列——每個都帶自己的位置,而不是一團你得自己解析的純文字。
我能對手機拍的照片做 OCR 嗎?
能。載入時套用 EXIF orientation,所以回傳的座標與顯示出來的照片對齊,帶方向的邊界框會跟隨手持拍攝的傾斜。稍微歪斜的照片也能對齊。
圖像 OCR 會保留每個值的位置嗎?
會。每個值都連同一個邊界框(0–1000 正規化格線上的 xmin/ymin/xmax/ymax)、四個帶方向的頂點,以及一個 match_ratio 一起回傳。match_ratio 達到 0.85 以上視為可信比對,1.0 表示每個字元都在圖像上被找到。
我怎麼把圖像傳給 API?
傳送到 POST /ocr/fields,作為 URL(imageType 'url')或純 base64(imageType 'base64',不帶 data-URI 前綴)。用 Bearer 權杖認證,金鑰以 spocr_ 開頭。傳一個內建 templateId 或你自己的 fields。
圖像 OCR 多少錢?
每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫(Starter 與 Pro)增加每月掃描數、更多工作表與儲存——見上方的方案。

把你自己的圖像變成可核對的資料

免費額度——每月 100 次掃描,免信用卡。每個值都連同它在圖像上的位置一起回傳。

相關