space ocr
指南文章价格文档
documents

如何从图片中提取表格数据并转换为CSV

将表格、订单或送货单的照片转换成干净的CSV文件。了解space-ocr如何处理分项列表,确保每一行数据都被准确提取。

4 分钟阅读· 2026-07-02

将扫描件或图片里的表格数据录入到电子表格中,是一项费时费力的传统工作。你可能有一张清晰的送货单或采购单图片,上面列满了各种项目,但它们都只是像素点。接下来的步骤通常是繁琐的手工录入:逐字逐句地将品名、数量和价格复制到新的一行里。这个过程不仅慢,而且一个打字错误就可能让整份数据出错。

一份表格形式的订单/送货单文件
一个分项列表格——多行数据,输出格式统一。

一个更高效的方法是,将表格的结构看作一个模板。你不再是简单地提取一大块文本,而是可以预先定义好你需要的列。对于重复出现的项目列表,你可以将其定义为一个数组,并为其设定子列,如“名称”、“单价”和“数量”。当你上传图片时,space-ocr会根据这个结构来处理它,将图片中的每一行都转换成一条结构化的数据记录。

为分项列表定义一个数组字段,然后上传图片,即可将表格提取到一个结构化的网格中。

即使是包含重复值的密集型表格,这种方法也同样有效。系统首先使用大型语言模型来初步提取文本,但这只是第一步。对于每一个值,比如品名“株式会社山治”或单价“580”,系统都会进行交叉验证。它会将语言模型的建议与文档的列结构进行比对,并根据页面上原始识别出的符号进行逐字符匹配。这一验证步骤可以有效防止数据在相邻行之间发生错位。

数据提取完成后,只需一键即可将整个工作表导出为干净的CSV文件。
✓ Verified

每一个提取出的值都会与源图像进行核对。系统会将AI建议的文本,与页面上实际OCR识别出的符号进行逐一匹配。这个过程会生成一个match_ratio置信度分数;分数达到0.85或更高表示匹配度很高。每个值的边界框坐标都来自于这些匹配上的符号,并被归一化到0-1000的范围,为每一条数据提供了可供核查的溯源信息。

费用按使用量计算,每处理一张图片收费$0.05。您的账户每月包含100次免费扫描。如果因任何原因提取失败,我们不会收取任何费用。

  1. 定义工作表模板 (Schema)
    创建一个新的工作表(Sheet)并定义您需要的列。对于分项列表,请使用'array'类型,并为其添加名称、数量、价格等子列。
  2. 上传您的图片
    通过拖拽或使用API将表格图片上传到该工作表。
  3. 检查提取的数据
    图片将根据您定义的模板进行处理。表格中的每个分项都会在工作表中显示为一行结构化数据。
  4. 按需修正
    点击任意单元格,即可在图片上看到对应的区域。您可以直接在网格中手动修正任何数值。
  5. 导出为CSV
    点击“导出”按钮并选择CSV格式。您的表格数据(包括所有分项)将被下载为一个干净、结构化的文件。
如果我的表格有合并单元格或复杂的布局怎么办?
本系统专为标准的行列式表格设计。对于非常复杂的布局,您可以定义多个模板(schema),或在初步提取后于工作表中手动调整数据。
CSV导出功能如何处理分项列表?
如果您的数组列名为'items',且其子列为'name'和'price',那么导出的CSV文件表头将是'items.name'和'items.price'。图片中的每一个分项都会成为CSV文件中的独立一行。
我可以处理带有表格的PDF文件吗?
可以,在网页应用中支持。您可以直接拖入一个PDF文件,系统会自动将其每一页渲染成图片进行处理。API本身接受的是如JPEG和PNG等光栅图像格式。
每个单元格的坐标是如何确定的?
对于每个提取出的值,系统会将其字符与页面上OCR识别出的符号进行匹配。这一验证步骤会生成一个置信度分数和一个归一化到0-1000范围的边界框,确保其位置信息能与原始文档对应。
表格的行数有限制吗?
技术上没有硬性的行数限制。处理性能取决于图片的清晰度和表格的复杂度。本系统旨在处理发票、订单等典型的商业文件。

将您的图片表格转化为数据

每月获取100次免费扫描。无需信用卡即可开始使用。

相关文章