Invoice OCR

把供应商发票变成可信数据的发票 OCR

别再手动录入发票。space-ocr 读出供应商、单号、日期、合计和每一条明细行，并把每个值连同它在页面上的位置和匹配分数一起返回。

每一张进到收件箱的发票，都是一笔小小的录入税。有人打开 PDF，找出供应商、发票号、日期、税额行、合计，再把这些全部重新敲进会计系统——要明细的话，还得一行行手抄。又慢，又是错字的温床，合计敲错一个数字就能卡住一次付款。

发票 OCR 本该把这件事接过去：读发票，返回字段。问题在于，大多数工具递给你一个数字，然后让你自己去信。space-ocr 把发票读成结构化的行，并把每个值连同它在页面上被读取的确切位置一起返回——一个看得见的框，外加一个表示匹配程度的分数。所以在批准付款之前，你可以核对那个数字，而不是盲信它。

看一张你可以亲自核对的真实发票

把鼠标悬停在下方任意字段上——发票上的框就是这个值被读取的位置。供应商、开票日期、账单周期、付款期限、应付金额、合计，以及每一条明细行，都直接读自一次真实的解析结果，而不是摆拍。

Verified fields

Invoice

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

每个值都有位置

供应商、发票号、开票日期、付款期限和每个金额，都连同一个边界框（0–1000 网格上的 xmin/ymin/xmax/ymax）、四个带方向的顶点和一个 match_ratio 一起返回——合计可追溯到页面上的确切位置。

不只是合计，还有明细行

把明细行作为带 children 的 array 字段来请求，描述一行（品名、数量、单价、金额）。每个单元格都保留自己的框，所以换行或合并的行也能追踪。

内置发票模板

传入 templateId 'invoice'，常用字段就已预先定义好——不必写 schema。版式不同？覆盖或新增你自己的字段即可。

税额与合计

小计、税额行和总额各自作为独立字段返回，连同千位分隔符原样保留，每个值都带框和分数，入账前即可核对。

干净的导出

带 UTF-8 BOM 的 CSV（Excel 与中日韩文本安全，明细行展开为子行），以及 REST API 的 JSON——直接进你的表格或会计导入。

AP（应付）自动化

把发票作为异步任务发到 /upload，每张读完后收到一个签名 Webhook，新的供应商发票就会自动流入表格，不必有人盯着队列。

space-ocr 里的发票 OCR 如何工作

把发票拖进应用，它会被读成一行——供应商、日期、金额，明细行则成为一张可以排序、筛选、导出的子表。PDF 发票会先按页渲染成图片，再被读取。如果你直接调用 API，请发送页面图片（公开 API 接收栅格图像——JPEG、PNG、GIF、BMP、TIFF、WebP），返回的结构化结果是一样的。

常见发票不必从头描述。传一个内置 templateId invoice，或定义你自己的 fields——明细行用一个带 children 的 array 字段来描述一行。

从页面图片提取发票字段

curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice-page-1.png",
    "imageType": "url",
    "templateId": "invoice"
  }'

如何对发票做 OCR

添加发票
在应用中拖入发票（PDF 或图片）——每一页会被渲染成图片并排队 OCR。做 AP 自动化时，把它发到 /upload，读完后收到 Webhook。
使用发票模板
供应商、单号、日期、合计用内置 templateId 'invoice'，或提供你自己的 fields——明细行用带 children 的 array 字段。
读取结构化结果
每个值连同它的 bbox、vertices、match_ratio 和 bbox_source 一起返回，还有一个定位发票上每个字段的 field_bboxes 映射。
入账前先核对
点击任意金额即可高亮它被读取的确切区域；低于 0.85 的 match_ratio 会标记出值得复核的值。编辑会保存在原始 OCR 值旁边。
导出或查询
为会计导入下载 CSV（UTF-8 BOM，明细行已展开），或用 GET /view 配合 where、sort、select 查询已存储的表格——无需重跑 OCR，也不额外收费。

简单、可预期的定价

每张图片 $0.05（¥10 / ₩100），含每月 100 次扫描的免费额度，无需信用卡。套餐计划增加每月扫描数、更多表格和存储空间。

Free

100 次扫描/月
3 表格
1 GB 存储

免费 — 无需信用卡

Starter

$19/月

400 次扫描/月
10 表格
10 GB 存储

免费开始

最受欢迎

Pro

$49/月

1,100 次扫描/月
无限表格
100 GB 存储

免费开始

发票 OCR 能从发票里取出什么？

供应商名、发票号、开票日期、付款期限、账单周期、小计、税额和总额，各自作为字段取出，再把明细行作为可重复的行（品名、数量、单价、金额）返回。每个值都带页面上的框和匹配分数。

它能读明细行，而不只是合计吗？

能。把明细行作为 type 为 'array' 的字段来请求，其 children 描述一行。每个单元格保留自己的边界框，所以换行或合并的明细行也能追溯到位置，导出时展开为子行。

我怎么知道它读出的合计是对的？

每个值都连同一个边界框（0–1000 网格上的 xmin/ymin/xmax/ymax）、四个带方向的顶点和一个 match_ratio 返回。输出会与页面上真实的 OCR 符号做核对，0.85 及以上为可信匹配，1.0 表示每个字符都被找到。点击单元格即可高亮它被读取的确切区域。

我能把发票导出成 CSV 或导入会计吗？

能。下载带 UTF-8 BOM 的 CSV（让 Excel 正确打开中日韩文本，明细行展开为子行），或用 REST API 的 JSON。把发票作为异步任务发到 /upload，每张读完后会触发一个签名 Webhook。

它支持 PDF 发票吗？

Web 应用直接接受 PDF 发票——它把每一页渲染成图片再做 OCR。公开 API 接收栅格图像（JPEG、PNG、GIF、BMP、TIFF、WebP），因此调用 API 时你发送页面图片。

发票 OCR 多少钱？

每张图片 $0.05（¥10 / ₩100），含每月 100 次扫描的免费额度，无需信用卡。套餐计划（Starter 和 Pro）增加每月扫描数、更多表格和存储——见上方的计划。

把你的供应商发票变成可核对的数据

免费额度——每月 100 次扫描，无需信用卡。每个值都连同它在页面上的位置一起返回。

免费开始 API 文档