space ocr
文章文档
receipts

将纸质收据数字化,用于费用报销

还在手动录入数据?学习如何将成堆的纸质收据转换成干净的 CSV 文件,用于费用报销。只需几分钟,即可完成扫描、核对和导出。

5 分钟阅读· 2026-06-26

每到月底,一项熟悉的任务就摆在面前:处理成堆的纸质收据,准备费用报销。每一张都需要手动录入电子表格——这个过程不仅缓慢、耗时,还容易出错。

如果有个工具能帮你自动读取收据呢?你可以通过下面这张真实的日本收据看看它是如何工作的。点击右侧的任何字段,就能在左侧图片上看到对应信息的位置。

Source receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Every value carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

一张拍摄的纸质收据
一张普通的纸质收据——月底时常会堆积成山。

整个工作流程非常直接。首先,在 space-ocr 中创建一个“Sheet”,并定义需要抓取的列,例如“商家”、“日期”和“总金额”。你还可以为消费明细创建一个“数组”类型的列。然后,拖放你的收据图片即可。应用支持 JPEG 和 PNG 等常见格式;如果你上传的是包含多张收据扫描件的多页 PDF,系统会自动将每一页作为单独的图片处理。系统会读取每张图片,并在你的 Sheet 中填充为新的一行。

一次性定义好列,然后批量上传收据图片。

工具内置了核对功能。在审查提取的数据时,你可以点击任何一个单元格——比如“KINSHO”收据上总金额为“2,045”的单元格——系统会立即在原始收据图片上高亮显示该文本的确切位置。数据与其在页面上的来源直接关联,形成了一条清晰的审计线索,让你能放心地抽查核对数字。

将所有结构化的收据数据导出为单个 CSV 文件。
✓ Verified

space-ocr 为它提取的每一条数据都提供了依据。AI 会建议一个值,但引擎会通过将该值与页面 OCR 识别出的符号进行逐字匹配来确认。这个过程会生成一个 match_ratio 分数(0.85 或更高通常表示匹配可信),以及该值精确的 xmin, ymin, xmax, ymax 坐标。这些坐标被归一化到 0-1000 的网格中,因此无论原始图像尺寸如何,你始终可以将一个值追溯到其来源。

定价模式很简单:处理一张收据的费用是 5 美分($0.05)。如果系统无法读取收据或处理失败,你不会被收费。免费套餐每月包含 100 次扫描,无需信用卡即可开始使用。

  1. 创建工作表 (Sheet)
    在你的工作空间中,创建一个新的 Sheet,并定义需要抓取的列,例如商家、日期、总金额,以及一个用于记录消费明细的数组。
  2. 上传收据
    将你的图片文件(JPG、PNG)或多页 PDF 拖放到工作表中。每张图片或 PDF 页面都将作为一个独立的条目进行处理。
  3. 审查与核对
    点击生成表格中的任意单元格。原始收据图片将会出现,并高亮显示相应的值,方便你快速核对。
  4. 导出为 CSV
    审查完数据后,点击导出按钮即可下载一个 CSV 文件,可以直接导入 Excel 或你的会计软件中。
我可以上传哪些文件类型?
你可以上传 JPEG、PNG 和 WebP 等标准图片文件。网页应用也支持 PDF 文件,它会自动将 PDF 的每一页转换为一张图片进行处理。
单张收据中的消费明细在 CSV 文件中是如何处理的?
在导出的 CSV 文件中,每条消费明细会扩展成独立的一行。主要的收据信息(如商店名称和日期)会在每一行重复出现,并且列标题会进行嵌套,例如 'items.description' 和 'items.price'。
在 Excel 中打开时,日文或其他字符会显示为乱码吗?
不会。CSV 文件以带字节顺序标记(BOM)的 UTF-8 格式导出,这能确保像 Microsoft Excel 这样的程序正确解析和显示特殊字符,包括日语和其他语言的字符。
space-ocr 如何验证其找到数据的位置?
每一个提取出的值都会与底层 OCR 引擎找到的文本进行交叉比对。这个过程会生成一个置信度分数和页面上精确的 0-1000 归一化坐标,以供审计。这让你能够核实任何一条数据的来源。
如果上传失败或收据无法读取,费用是多少?
扫描失败不收取任何费用。你只需为成功提取的数据付费,价格为每张图片 $0.05。
我需要告诉系统收据的语言吗?
不需要,语言检测是全自动的。你可以提交各种语言的收据,系统会自动识别语言并相应地处理文本。

告别成堆的收据

每月前 100 次扫描免费,无需信用卡。

相关文章