Japanese OCR

把文件變成可核對資料的日語 OCR

用 space-ocr 讀取日語收據、發票與送貨單：混合文字、全形與直書、不亂碼的中日韓安全 CSV，每個值都連同位置與比對分數一起回傳。

日語是普通 OCR 悄悄崩掉的地方。一張收據裡混著漢字、假名、半形片假名、全形數字，偶爾還有一段英文，而合計可能直書在右邊緣的一列裡。大多數工具要麼先讓你選語言，要麼回傳一團丟了版面的扁平文字。真正有用的日語 OCR 必須一次讀完這些，並告訴你每個數字來自哪裡。

space-ocr 兩件事都做。它讀 JP 文件、回傳結構化欄位，並把每個值連同它在頁面上被讀取的確切位置一起回傳——一個看得見的框，加上一個表示文字與頁面上偵測到的字元比對程度的分數。語言辨識是自動的，沒有提示要設，日文、韓文、中文、英文由一個引擎一起處理。

看一次你可以親自核對的真實日語擷取

把滑鼠移到下方任一欄位上。這裡讀的兩張收據是真實資料——合計 2,045 的 KINSHO 布施店與合計 4,286 的ライフ国分店，都是 2019 年 8 月的日期。每個值、框與比對分數都直接讀自一次真實的解析結果，而不是擺拍，框會跟隨每一列混著漢字、假名與數字的文字。

Receipts with extracted-field bounding boxes

Verified fields

KINSHO · 合計 2,045

ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

語言辨識自動完成

沒有語言提示要選。一次低成本的視覺處理會偵測文字並路由，所以日文、韓文、中文、英文不用你標註任何東西就走同一個引擎。

全形、直書、混合文字

漢字、平假名、片假名、半形片假名、全形數字與英文同在一列也會一起正規化。直書列依文字流向偵測，歸入正確的列。

不亂碼的中日韓安全 CSV

匯出是帶 UTF-8 BOM 的 CSV，所以店舗名、合計與商品名在 Excel 裡不會亂碼，能正確開啟。明細列展開為子列。

每個值都有位置

每個欄位回傳一個邊界框（0–1000 格線上的 xmin/ymin/xmax/ymax）、四個帶方向的頂點與一個 match_ratio——2,045 可追溯到收據上的確切位置。

真實 JP 文件，含明細列

收據、發票、送貨單連同合計、日期、店名回傳，每一筆明細一列重複列，每個儲存格即使換行也保留自己的位置。

手機照片也行

載入時套用 EXIF 旋轉，框會跟隨文件的傾斜，所以斜著拍的、皺巴巴的收據也能對齊。

space-ocr 裡的日語 OCR 如何運作

LLM 從不捏造座標。它讀文件、回傳每個值加上用到的 word-token ID，然後字元比對器先執行，把這些字元與 Vision 在頁面上真正偵測到的符號比對。這次比對產出框、帶方向的四頂點與 match_ratio；token ID 是次級覆寫。所以同一個數字的全形與半形會歸到一個值，每個欄位都帶一個信賴訊號，你得到的是可以核對的值，而不是只能盲信的數字。

把 PDF 拖進應用程式，每一頁會先被算繪成圖片再讀取——對多頁發票與送貨單很方便。如果你直接呼叫 API，請傳送頁面圖片（公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP），回傳的結構化結果一樣。傳一個內建 templateId，例如 receipt、invoice 或 delivery，或定義你自己的 fields——明細列用一個帶 children 的 array 欄位來描述一列。

從日語收據圖片擷取欄位

curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/receipt-jp.jpg",
    "imageType": "url",
    "templateId": "receipt"
  }'

如何對日語文件做 OCR

加入你的文件
在應用程式中拖入收據、發票或 PDF——每一頁會被算繪成圖片並排入 OCR 佇列。使用 API 時，把頁面圖片（url 或 base64）傳送到 /ocr/fields。不需要設定語言。
選擇範本或欄位
傳一個內建 templateId，例如 'receipt'、'invoice' 或 'delivery'，或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
讀取結構化結果
每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳，還有一個定位頁面上每個欄位的 field_bboxes 對應表——含全形與直書文字。
隨時核對
點擊儲存格即可高亮它被讀取的確切區域；低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
匯出或查詢
下載 CSV（UTF-8 BOM，日語能乾淨開啟，明細列已展開），或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR，也不額外收費。