把文件變成可核對資料的日語 OCR
用 space-ocr 讀取日語收據、發票與送貨單:混合文字、全形與直書、不亂碼的中日韓安全 CSV,每個值都連同位置與比對分數一起回傳。
日語是普通 OCR 悄悄崩掉的地方。一張收據裡混著漢字、假名、半形片假名、全形數字,偶爾還有一段英文,而合計可能直書在右邊緣的一列裡。大多數工具要麼先讓你選語言,要麼回傳一團丟了版面的扁平文字。真正有用的日語 OCR 必須一次讀完這些,並告訴你每個數字來自哪裡。
space-ocr 兩件事都做。它讀 JP 文件、回傳結構化欄位,並把每個值連同它在頁面上被讀取的確切位置一起回傳——一個看得見的框,加上一個表示文字與頁面上偵測到的字元比對程度的分數。語言辨識是自動的,沒有提示要設,日文、韓文、中文、英文由一個引擎一起處理。
看一次你可以親自核對的真實日語擷取
把滑鼠移到下方任一欄位上。這裡讀的兩張收據是真實資料——合計 2,045 的 KINSHO 布施店與合計 4,286 的 ライフ 国分店,都是 2019 年 8 月的日期。每個值、框與比對分數都直接讀自一次真實的解析結果,而不是擺拍,框會跟隨每一列混著漢字、假名與數字的文字。

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.
space-ocr 裡的日語 OCR 如何運作
LLM 從不捏造座標。它讀文件、回傳每個值加上用到的 word-token ID,然後字元比對器先執行,把這些字元與 Vision 在頁面上真正偵測到的符號比對。這次比對產出框、帶方向的四頂點與 match_ratio;token ID 是次級覆寫。所以同一個數字的全形與半形會歸到一個值,每個欄位都帶一個信賴訊號,你得到的是可以核對的值,而不是只能盲信的數字。
把 PDF 拖進應用程式,每一頁會先被算繪成圖片再讀取——對多頁發票與送貨單很方便。如果你直接呼叫 API,請傳送頁面圖片(公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP),回傳的結構化結果一樣。傳一個內建 templateId,例如 receipt、invoice 或 delivery,或定義你自己的 fields——明細列用一個帶 children 的 array 欄位來描述一列。
curl -s https://api.space-ocr.com/ocr/fields \
-H "Authorization: Bearer $SPACE_OCR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"image": "https://example.com/receipt-jp.jpg",
"imageType": "url",
"templateId": "receipt"
}'如何對日語文件做 OCR
- 加入你的文件在應用程式中拖入收據、發票或 PDF——每一頁會被算繪成圖片並排入 OCR 佇列。使用 API 時,把頁面圖片(url 或 base64)傳送到 /ocr/fields。不需要設定語言。
- 選擇範本或欄位傳一個內建 templateId,例如 'receipt'、'invoice' 或 'delivery',或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
- 讀取結構化結果每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳,還有一個定位頁面上每個欄位的 field_bboxes 對應表——含全形與直書文字。
- 隨時核對點擊儲存格即可高亮它被讀取的確切區域;低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
- 匯出或查詢下載 CSV(UTF-8 BOM,日語能乾淨開啟,明細列已展開),或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR,也不額外收費。
簡單、可預期的定價
每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫增加每月掃描數、更多工作表與儲存空間。