Image OCR

回傳結構化欄位而不是一堆文字的圖像 OCR

用 space-ocr 對 JPEG、PNG 等圖像做 OCR：內建範本、明細列、CSV/JSON 匯出，每個值都連同它在圖像上的框與比對分數一起回傳。

大多數圖像 OCR只是丟給你一堆純文字，然後就沒了。你拍一張收據，跑一遍，回來的是一團列，你還得自己去讀、去拆、再輸入到對應的欄裡。原本在頁面上一眼就能看清的結構，沒了。

space-ocr 把圖像讀成結構化欄位——店名在這、日期在那、合計在那邊、明細是一列列的。並且把每個值連同它在圖像上被讀取的確切位置一起回傳：一個看得見的框，加上一個表示它與像素比對程度的分數。所以你不必盲信擷取結果，而是可以看著照片親自核對。

看一次你可以親自核對的真實擷取

這是一張圖像——拍了兩張收據的照片——被讀成了欄位。把滑鼠移到下方任一值上，圖像上的框就是這個值被讀取的位置。這裡的每個數字、框與比對分數，都直接讀自一次真實的解析結果，而不是擺拍。

Receipts with extracted-field bounding boxes

Verified fields

KINSHO · 合計 2,045

ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

結構化欄位，不是一堆文字

圖像會變成帶名字的欄位與列——店名、日期、合計、明細列——可以直接進試算表，而不是一串你得自己去拆的長字串。

每個值都有位置

每個欄位回傳一個邊界框（0–1000 格線上的 xmin/ymin/xmax/ymax）、四個帶方向的頂點與一個 match_ratio——值可追溯到圖像上的確切位置。

手機照片也行

載入時套用 EXIF 旋轉，所以回傳的座標與你看到的圖像對齊；帶方向的框也會跟隨手持拍攝的傾斜。

內建範本

用一個 templateId 套用收據、發票、送貨單、名片或駕照範本——也可以定義你自己的欄位。

不只是合計，還有明細列

表格以可重複的列回傳，每個儲存格都帶位置，即使在擁擠的圖像上一列換行或合併也能追蹤。

乾淨的匯出

帶 UTF-8 BOM 的 CSV（Excel 與中日韓文字安全，明細列展開），以及帶非同步工作與簽章 Webhook 的 REST API JSON。

space-ocr 裡的圖像 OCR 如何運作

把圖像以 URL 或純 base64 傳送到 /ocr/fields——JPEG、PNG、GIF、BMP、TIFF、WebP 都會被直接讀取。載入時套用 EXIF orientation，所以回傳的框與顯示出來的照片對齊，就算是斜著拿手機拍的也一樣。

常見文件不必寫 schema。傳一個內建 templateId，例如 receipt 或 invoice，或定義你自己的 fields——明細列用一個帶 children 的 array 欄位來描述一列。（PDF 走 Web 應用，先把每一頁算繪成圖片；API 本身讀的是圖像。）

從圖像擷取欄位

curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/receipt-photo.jpg",
    "imageType": "url",
    "templateId": "receipt"
  }'

如何對圖像做 OCR

傳送你的圖像
把 JPEG、PNG、GIF、BMP、TIFF 或 WebP 以 URL 或純 base64 傳送到 /ocr/fields，或拖進應用程式。載入時會套用 EXIF 旋轉。
選擇範本或欄位
傳一個內建 templateId，例如 'receipt' 或 'invoice'，或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
讀取結構化結果
每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳，還有一個定位圖像上每個欄位的 field_bboxes 對應表。
隨時核對
點擊一個值即可高亮它被讀取的確切區域；低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
匯出或查詢
下載 CSV（UTF-8 BOM，明細列已展開），或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR，也不額外收費。