Japanese OCR

把文档变成可核对数据的日语 OCR

用 space-ocr 读取日语票据、发票和送货单：混合文字、全角与竖排、不乱码的中日韩安全 CSV，每个值都连同位置和匹配分数一起返回。

日语是普通 OCR 悄悄崩掉的地方。一张票据里混着汉字、假名、半角片假名、全角数字，偶尔还有一段英文，而合计可能竖排在右边缘的一列里。大多数工具要么先让你选语言，要么返回一团丢了版面的扁平文本。真正有用的日语 OCR 必须一次读完这些，并告诉你每个数字来自哪里。

space-ocr 两件事都做。它读 JP 文档、返回结构化字段，并把每个值连同它在页面上被读取的确切位置一起返回——一个看得见的框，外加一个表示文本与页面上检测到的字符匹配程度的分数。语言识别是自动的，没有提示要设，日语、韩语、中文、英文由一个引擎一起处理。

看一次你可以亲自核对的真实日语提取

把鼠标悬停在下方任意字段上。这里读的两张票据是真实数据——合计 2,045 的 KINSHO 布施店和合计 4,286 的ライフ国分店，都是 2019 年 8 月的日期。每个值、框和匹配分数都直接读自一次真实的解析结果，而不是摆拍，框会跟随每一行混着汉字、假名和数字的文本。

Receipts with extracted-field bounding boxes

Verified fields

KINSHO · 合計 2,045

ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

语言识别自动完成

没有语言提示要选。一次低成本的视觉处理会检测文字并路由，所以日语、韩语、中文、英文不用你标注任何东西就走同一个引擎。

全角、竖排、混合文字

汉字、平假名、片假名、半角片假名、全角数字和英文同在一行也会一起归一化。竖排列按文本流向检测，归入正确的行。

不乱码的中日韩安全 CSV

导出是带 UTF-8 BOM 的 CSV，所以店舗名、合計和商品名在 Excel 里不会乱码，能正确打开。明细行展开为子行。

每个值都有位置

每个字段返回一个边界框（0–1000 网格上的 xmin/ymin/xmax/ymax）、四个带方向的顶点和一个 match_ratio——2,045 可追溯到票据上的确切位置。

真实 JP 文档，含明细行

票据、发票、送货单连同合计、日期、店名返回，每一条明细一行重复行，每个单元格即使换行也保留自己的位置。

手机照片也行

加载时应用 EXIF 旋转，框会跟随文档的倾斜，所以斜着拍的、皱巴巴的票据也能对齐。

space-ocr 里的日语 OCR 如何工作

LLM 从不编造坐标。它读文档、返回每个值加上用到的 word-token ID，然后字符匹配器先运行，把这些字符与 Vision 在页面上真正检测到的符号比对。这次比对产出框、带方向的四顶点和 match_ratio；token ID 是次级覆盖。所以同一个数字的全角和半角会归到一个值，每个字段都带一个置信信号，你得到的是可以核对的值，而不是只能盲信的数字。

把 PDF 拖进应用，每一页会先被渲染成图片再读取——对多页发票和送货单很方便。如果你直接调用 API，请发送页面图片（公开 API 接收栅格图像——JPEG、PNG、GIF、BMP、TIFF、WebP），返回的结构化结果一样。传一个内置 templateId，比如 receipt、invoice 或 delivery，或者定义你自己的 fields——明细行用一个带 children 的 array 字段来描述一行。

从日语票据图片提取字段

curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/receipt-jp.jpg",
    "imageType": "url",
    "templateId": "receipt"
  }'

如何对日语文档做 OCR

添加你的文档
在应用中拖入票据、发票或 PDF——每一页会被渲染成图片并排队 OCR。使用 API 时，把页面图片（url 或 base64）发送到 /ocr/fields。不需要设置语言。
选择模板或字段
传一个内置 templateId，比如 'receipt'、'invoice' 或 'delivery'，或提供你自己的 fields——明细行表格用带 children 的 array 字段。
读取结构化结果
每个值连同它的 bbox、vertices、match_ratio 和 bbox_source 一起返回，还有一个定位页面上每个字段的 field_bboxes 映射——含全角和竖排文本。
随时核对
点击单元格即可高亮它被读取的确切区域；低于 0.85 的 match_ratio 会标记出值得复核的值。编辑会保存在原始 OCR 值旁边。
导出或查询
下载 CSV（UTF-8 BOM，日语能干净打开，明细行已展开），或用 GET /view 配合 where、sort、select 查询已存储的表格——无需重跑 OCR，也不额外收费。

简单、可预期的定价

每张图片 $0.05（¥10 / ₩100），含每月 100 次扫描的免费额度，无需信用卡。套餐计划增加每月扫描数、更多表格和存储空间。

Free

100 次扫描/月
3 表格
1 GB 存储

免费 — 无需信用卡

Starter

$19/月

400 次扫描/月
10 表格
10 GB 存储

免费开始

最受欢迎

Pro

$49/月

1,100 次扫描/月
无限表格
100 GB 存储

免费开始

我必须告诉它文档是日语吗？

不用。语言识别是自动的，没有语言提示或选择器要设。一次低成本的视觉处理会检测文字并路由，所以日语、韩语、中文、英文都走同一个引擎，混在一起的文档也一样。

它能处理全角字符和竖排文本吗？

能。汉字、平假名、片假名、半角片假名、全角数字和英文同在一行也会一起归一化，竖排列按文本流向检测并归入正确的行。返回的框不论方向都跟随每一行。

导出 CSV 时日语会乱码吗？

不会。CSV 带 UTF-8 BOM 写出，所以店舗名、合計和商品名在 Excel 里能正确打开而不乱码，明细行展开为子行。REST API 的 JSON 也原样保留这些值。

日语 OCR 会保留每个值的位置吗？

会。每个值都连同一个边界框（0–1000 归一化网格上的 xmin/ymin/xmax/ymax）、跟随文档倾斜的四个顶点，以及一个 match_ratio 一起返回。match_ratio 达到 0.85 及以上视为可信匹配，1.0 表示每个字符都在页面上被找到。

它能读哪些日语文档？

票据、发票、送货单、名片、证件和自由格式表单的栅格图像。套用一个内置 templateId，比如 receipt、invoice 或 delivery，或者定义你自己的 fields——明细行表格用带 children 的 array 字段。

日语 OCR 多少钱？

每张图片 $0.05（¥10 / ₩100），含每月 100 次扫描的免费额度，无需信用卡。套餐计划（Starter 和 Pro）增加每月扫描数、更多表格和存储——见上方的计划。

把你自己的日语文档变成可核对的数据

免费额度——每月 100 次扫描，无需信用卡。每个值都连同它在页面上的位置一起返回。

免费开始 API 文档