space ocr
指南文章价格文档
Invoice OCR

把供应商发票变成可信数据的发票 OCR

别再手动录入发票。space-ocr 读出供应商、单号、日期、合计和每一条明细行,并把每个值连同它在页面上的位置和匹配分数一起返回。

每一张进到收件箱的发票,都是一笔小小的录入税。有人打开 PDF,找出供应商、发票号、日期、税额行、合计,再把这些全部重新敲进会计系统——要明细的话,还得一行行手抄。又慢,又是错字的温床,合计敲错一个数字就能卡住一次付款。

发票 OCR 本该把这件事接过去:读发票,返回字段。问题在于,大多数工具递给你一个数字,然后让你自己去信。space-ocr 把发票读成结构化的行,并把每个值连同它在页面上被读取的确切位置一起返回——一个看得见的框,外加一个表示匹配程度的分数。所以在批准付款之前,你可以核对那个数字,而不是盲信它。

看一张你可以亲自核对的真实发票

把鼠标悬停在下方任意字段上——发票上的框就是这个值被读取的位置。供应商、开票日期、账单周期、付款期限、应付金额、合计,以及每一条明细行,都直接读自一次真实的解析结果,而不是摆拍。

Invoice with extracted-field bounding boxes
Verified fields
Invoice

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

每个值都有位置
供应商、发票号、开票日期、付款期限和每个金额,都连同一个边界框(0–1000 网格上的 xmin/ymin/xmax/ymax)、四个带方向的顶点和一个 match_ratio 一起返回——合计可追溯到页面上的确切位置。
不只是合计,还有明细行
把明细行作为带 children 的 array 字段来请求,描述一行(品名、数量、单价、金额)。每个单元格都保留自己的框,所以换行或合并的行也能追踪。
内置发票模板
传入 templateId 'invoice',常用字段就已预先定义好——不必写 schema。版式不同?覆盖或新增你自己的字段即可。
税额与合计
小计、税额行和总额各自作为独立字段返回,连同千位分隔符原样保留,每个值都带框和分数,入账前即可核对。
干净的导出
带 UTF-8 BOM 的 CSV(Excel 与中日韩文本安全,明细行展开为子行),以及 REST API 的 JSON——直接进你的表格或会计导入。
AP(应付)自动化
把发票作为异步任务发到 /upload,每张读完后收到一个签名 Webhook,新的供应商发票就会自动流入表格,不必有人盯着队列。

space-ocr 里的发票 OCR 如何工作

把发票拖进应用,它会被读成一行——供应商、日期、金额,明细行则成为一张可以排序、筛选、导出的子表。PDF 发票会先按页渲染成图片,再被读取。如果你直接调用 API,请发送页面图片(公开 API 接收栅格图像——JPEG、PNG、GIF、BMP、TIFF、WebP),返回的结构化结果是一样的。

常见发票不必从头描述。传一个内置 templateId invoice,或定义你自己的 fields——明细行用一个带 childrenarray 字段来描述一行。

从页面图片提取发票字段
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice-page-1.png",
    "imageType": "url",
    "templateId": "invoice"
  }'

如何对发票做 OCR

  1. 添加发票
    在应用中拖入发票(PDF 或图片)——每一页会被渲染成图片并排队 OCR。做 AP 自动化时,把它发到 /upload,读完后收到 Webhook。
  2. 使用发票模板
    供应商、单号、日期、合计用内置 templateId 'invoice',或提供你自己的 fields——明细行用带 children 的 array 字段。
  3. 读取结构化结果
    每个值连同它的 bbox、vertices、match_ratio 和 bbox_source 一起返回,还有一个定位发票上每个字段的 field_bboxes 映射。
  4. 入账前先核对
    点击任意金额即可高亮它被读取的确切区域;低于 0.85 的 match_ratio 会标记出值得复核的值。编辑会保存在原始 OCR 值旁边。
  5. 导出或查询
    为会计导入下载 CSV(UTF-8 BOM,明细行已展开),或用 GET /view 配合 where、sort、select 查询已存储的表格——无需重跑 OCR,也不额外收费。

简单、可预期的定价

每张图片 $0.05(¥10 / ₩100),含每月 100 次扫描的免费额度,无需信用卡。套餐计划增加每月扫描数、更多表格和存储空间。

Free
$0
  • 100 次扫描/月
  • 3 表格
  • 1 GB 存储
免费 — 无需信用卡
Starter
$19/月
  • 400 次扫描/月
  • 10 表格
  • 10 GB 存储
免费开始
最受欢迎
Pro
$49/月
  • 1,100 次扫描/月
  • 无限表格
  • 100 GB 存储
免费开始
发票 OCR 能从发票里取出什么?
供应商名、发票号、开票日期、付款期限、账单周期、小计、税额和总额,各自作为字段取出,再把明细行作为可重复的行(品名、数量、单价、金额)返回。每个值都带页面上的框和匹配分数。
它能读明细行,而不只是合计吗?
能。把明细行作为 type 为 'array' 的字段来请求,其 children 描述一行。每个单元格保留自己的边界框,所以换行或合并的明细行也能追溯到位置,导出时展开为子行。
我怎么知道它读出的合计是对的?
每个值都连同一个边界框(0–1000 网格上的 xmin/ymin/xmax/ymax)、四个带方向的顶点和一个 match_ratio 返回。输出会与页面上真实的 OCR 符号做核对,0.85 及以上为可信匹配,1.0 表示每个字符都被找到。点击单元格即可高亮它被读取的确切区域。
我能把发票导出成 CSV 或导入会计吗?
能。下载带 UTF-8 BOM 的 CSV(让 Excel 正确打开中日韩文本,明细行展开为子行),或用 REST API 的 JSON。把发票作为异步任务发到 /upload,每张读完后会触发一个签名 Webhook。
它支持 PDF 发票吗?
Web 应用直接接受 PDF 发票——它把每一页渲染成图片再做 OCR。公开 API 接收栅格图像(JPEG、PNG、GIF、BMP、TIFF、WebP),因此调用 API 时你发送页面图片。
发票 OCR 多少钱?
每张图片 $0.05(¥10 / ₩100),含每月 100 次扫描的免费额度,无需信用卡。套餐计划(Starter 和 Pro)增加每月扫描数、更多表格和存储——见上方的计划。

把你的供应商发票变成可核对的数据

免费额度——每月 100 次扫描,无需信用卡。每个值都连同它在页面上的位置一起返回。

相关