space ocr
指南文章價格文件
Japanese OCR

把文件變成可核對資料的日語 OCR

用 space-ocr 讀取日語收據、發票與送貨單:混合文字、全形與直書、不亂碼的中日韓安全 CSV,每個值都連同位置與比對分數一起回傳。

日語是普通 OCR 悄悄崩掉的地方。一張收據裡混著漢字、假名、半形片假名、全形數字,偶爾還有一段英文,而合計可能直書在右邊緣的一列裡。大多數工具要麼先讓你選語言,要麼回傳一團丟了版面的扁平文字。真正有用的日語 OCR 必須一次讀完這些,並告訴你每個數字來自哪裡。

space-ocr 兩件事都做。它讀 JP 文件、回傳結構化欄位,並把每個值連同它在頁面上被讀取的確切位置一起回傳——一個看得見的框,加上一個表示文字與頁面上偵測到的字元比對程度的分數。語言辨識是自動的,沒有提示要設,日文、韓文、中文、英文由一個引擎一起處理。

看一次你可以親自核對的真實日語擷取

把滑鼠移到下方任一欄位上。這裡讀的兩張收據是真實資料——合計 2,045 的 KINSHO 布施店與合計 4,286 的 ライフ 国分店,都是 2019 年 8 月的日期。每個值、框與比對分數都直接讀自一次真實的解析結果,而不是擺拍,框會跟隨每一列混著漢字、假名與數字的文字。

Receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

語言辨識自動完成
沒有語言提示要選。一次低成本的視覺處理會偵測文字並路由,所以日文、韓文、中文、英文不用你標註任何東西就走同一個引擎。
全形、直書、混合文字
漢字、平假名、片假名、半形片假名、全形數字與英文同在一列也會一起正規化。直書列依文字流向偵測,歸入正確的列。
不亂碼的中日韓安全 CSV
匯出是帶 UTF-8 BOM 的 CSV,所以 店舗名、合計 與商品名在 Excel 裡不會亂碼,能正確開啟。明細列展開為子列。
每個值都有位置
每個欄位回傳一個邊界框(0–1000 格線上的 xmin/ymin/xmax/ymax)、四個帶方向的頂點與一個 match_ratio——2,045 可追溯到收據上的確切位置。
真實 JP 文件,含明細列
收據、發票、送貨單連同合計、日期、店名回傳,每一筆明細一列重複列,每個儲存格即使換行也保留自己的位置。
手機照片也行
載入時套用 EXIF 旋轉,框會跟隨文件的傾斜,所以斜著拍的、皺巴巴的收據也能對齊。

space-ocr 裡的日語 OCR 如何運作

LLM 從不捏造座標。它讀文件、回傳每個值加上用到的 word-token ID,然後字元比對器先執行,把這些字元與 Vision 在頁面上真正偵測到的符號比對。這次比對產出框、帶方向的四頂點與 match_ratio;token ID 是次級覆寫。所以同一個數字的全形與半形會歸到一個值,每個欄位都帶一個信賴訊號,你得到的是可以核對的值,而不是只能盲信的數字。

把 PDF 拖進應用程式,每一頁會先被算繪成圖片再讀取——對多頁發票與送貨單很方便。如果你直接呼叫 API,請傳送頁面圖片(公開 API 接收點陣圖像——JPEG、PNG、GIF、BMP、TIFF、WebP),回傳的結構化結果一樣。傳一個內建 templateId,例如 receiptinvoicedelivery,或定義你自己的 fields——明細列用一個帶 childrenarray 欄位來描述一列。

從日語收據圖片擷取欄位
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/receipt-jp.jpg",
    "imageType": "url",
    "templateId": "receipt"
  }'

如何對日語文件做 OCR

  1. 加入你的文件
    在應用程式中拖入收據、發票或 PDF——每一頁會被算繪成圖片並排入 OCR 佇列。使用 API 時,把頁面圖片(url 或 base64)傳送到 /ocr/fields。不需要設定語言。
  2. 選擇範本或欄位
    傳一個內建 templateId,例如 'receipt'、'invoice' 或 'delivery',或提供你自己的 fields——明細列表格用帶 children 的 array 欄位。
  3. 讀取結構化結果
    每個值連同它的 bbox、vertices、match_ratio 與 bbox_source 一起回傳,還有一個定位頁面上每個欄位的 field_bboxes 對應表——含全形與直書文字。
  4. 隨時核對
    點擊儲存格即可高亮它被讀取的確切區域;低於 0.85 的 match_ratio 會標記出值得複核的值。編輯會儲存在原始 OCR 值旁邊。
  5. 匯出或查詢
    下載 CSV(UTF-8 BOM,日語能乾淨開啟,明細列已展開),或用 GET /view 搭配 where、sort、select 查詢已儲存的工作表——無需重跑 OCR,也不額外收費。

簡單、可預期的定價

每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫增加每月掃描數、更多工作表與儲存空間。

Free
$0
  • 100 次掃描/月
  • 3 工作表
  • 1 GB 儲存空間
免費 — 免信用卡
Starter
$19/月
  • 400 次掃描/月
  • 10 工作表
  • 10 GB 儲存空間
免費開始
最受歡迎
Pro
$49/月
  • 1,100 次掃描/月
  • 無限工作表
  • 100 GB 儲存空間
免費開始
我必須告訴它文件是日語嗎?
不用。語言辨識是自動的,沒有語言提示或選擇器要設。一次低成本的視覺處理會偵測文字並路由,所以日文、韓文、中文、英文都走同一個引擎,混在一起的文件也一樣。
它能處理全形字元與直書文字嗎?
能。漢字、平假名、片假名、半形片假名、全形數字與英文同在一列也會一起正規化,直書列依文字流向偵測並歸入正確的列。回傳的框不論方向都跟隨每一列。
匯出 CSV 時日語會亂碼嗎?
不會。CSV 帶 UTF-8 BOM 寫出,所以 店舗名、合計 與商品名在 Excel 裡能正確開啟而不亂碼,明細列展開為子列。REST API 的 JSON 也原樣保留這些值。
日語 OCR 會保留每個值的位置嗎?
會。每個值都連同一個邊界框(0–1000 正規化格線上的 xmin/ymin/xmax/ymax)、跟隨文件傾斜的四個頂點,以及一個 match_ratio 一起回傳。match_ratio 達到 0.85 以上視為可信比對,1.0 表示每個字元都在頁面上被找到。
它能讀哪些日語文件?
收據、發票、送貨單、名片、證件與自由格式表單的點陣圖像。套用一個內建 templateId,例如 receipt、invoice 或 delivery,或定義你自己的 fields——明細列表格用帶 children 的 array 欄位。
日語 OCR 多少錢?
每張圖片 $0.05(¥10 / ₩100),含每月 100 次掃描的免費額度,免信用卡。方案計畫(Starter 與 Pro)增加每月掃描數、更多工作表與儲存——見上方的方案。

把你自己的日語文件變成可核對的資料

免費額度——每月 100 次掃描,免信用卡。每個值都連同它在頁面上的位置一起回傳。

相關