把文档变成可核对数据的日语 OCR
用 space-ocr 读取日语票据、发票和送货单:混合文字、全角与竖排、不乱码的中日韩安全 CSV,每个值都连同位置和匹配分数一起返回。
日语是普通 OCR 悄悄崩掉的地方。一张票据里混着汉字、假名、半角片假名、全角数字,偶尔还有一段英文,而合计可能竖排在右边缘的一列里。大多数工具要么先让你选语言,要么返回一团丢了版面的扁平文本。真正有用的日语 OCR 必须一次读完这些,并告诉你每个数字来自哪里。
space-ocr 两件事都做。它读 JP 文档、返回结构化字段,并把每个值连同它在页面上被读取的确切位置一起返回——一个看得见的框,外加一个表示文本与页面上检测到的字符匹配程度的分数。语言识别是自动的,没有提示要设,日语、韩语、中文、英文由一个引擎一起处理。
看一次你可以亲自核对的真实日语提取
把鼠标悬停在下方任意字段上。这里读的两张票据是真实数据——合计 2,045 的 KINSHO 布施店和合计 4,286 的 ライフ 国分店,都是 2019 年 8 月的日期。每个值、框和匹配分数都直接读自一次真实的解析结果,而不是摆拍,框会跟随每一行混着汉字、假名和数字的文本。

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.
space-ocr 里的日语 OCR 如何工作
LLM 从不编造坐标。它读文档、返回每个值加上用到的 word-token ID,然后字符匹配器先运行,把这些字符与 Vision 在页面上真正检测到的符号比对。这次比对产出框、带方向的四顶点和 match_ratio;token ID 是次级覆盖。所以同一个数字的全角和半角会归到一个值,每个字段都带一个置信信号,你得到的是可以核对的值,而不是只能盲信的数字。
把 PDF 拖进应用,每一页会先被渲染成图片再读取——对多页发票和送货单很方便。如果你直接调用 API,请发送页面图片(公开 API 接收栅格图像——JPEG、PNG、GIF、BMP、TIFF、WebP),返回的结构化结果一样。传一个内置 templateId,比如 receipt、invoice 或 delivery,或者定义你自己的 fields——明细行用一个带 children 的 array 字段来描述一行。
curl -s https://api.space-ocr.com/ocr/fields \
-H "Authorization: Bearer $SPACE_OCR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"image": "https://example.com/receipt-jp.jpg",
"imageType": "url",
"templateId": "receipt"
}'如何对日语文档做 OCR
- 添加你的文档在应用中拖入票据、发票或 PDF——每一页会被渲染成图片并排队 OCR。使用 API 时,把页面图片(url 或 base64)发送到 /ocr/fields。不需要设置语言。
- 选择模板或字段传一个内置 templateId,比如 'receipt'、'invoice' 或 'delivery',或提供你自己的 fields——明细行表格用带 children 的 array 字段。
- 读取结构化结果每个值连同它的 bbox、vertices、match_ratio 和 bbox_source 一起返回,还有一个定位页面上每个字段的 field_bboxes 映射——含全角和竖排文本。
- 随时核对点击单元格即可高亮它被读取的确切区域;低于 0.85 的 match_ratio 会标记出值得复核的值。编辑会保存在原始 OCR 值旁边。
- 导出或查询下载 CSV(UTF-8 BOM,日语能干净打开,明细行已展开),或用 GET /view 配合 where、sort、select 查询已存储的表格——无需重跑 OCR,也不额外收费。
简单、可预期的定价
每张图片 $0.05(¥10 / ₩100),含每月 100 次扫描的免费额度,无需信用卡。套餐计划增加每月扫描数、更多表格和存储空间。