space ocr
文章文档
workspace

告别扫描仪后的混乱:为你的电子文件打造一个整理系统

别再被杂乱无章的扫描件淹没。学习如何将成堆的电子收据和发票,转变成一个结构清晰、内容可搜索的文件夹和表格库。

6 分钟阅读· 2026-06-28

你有一台扫描仪,或者只是用手机拍照。曾经堆满办公桌的纸质收据、发票和表格,现在变成了电脑里的一个文件夹。这看似是进步,但当你需要找三个月前的一笔开销时,又回到了原点:逐个打开几十个名为 scan_2024-08-17.jpg 的文件。

问题不在于数字化本身,而在于缺少一个管理这些电子副本的系统。一个装满图片的文件夹,不过是另一个数字化的杂物堆。要让这些数据变得有用,就需要提取、结构化并能随时找到。它们需要一个真正的“家”。

下面是一个结构化工作空间的运作方式。你可以与下面的示例互动,看看提取出的数据是如何与原始文档直接关联的。无需上传文件。

Receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

一张等待归档的扫描收据
众多文件中的一份——问题在于它最终会放在哪里,以及你是否能再次找到它。

解决方法是,不要把扫描件看作独立的文件,而是把它们当作你掌控的数据库中的条目。在 space-ocr 中,你的工作空间是一个由你亲手创建的、简单的文件夹和表格树状结构。你可以为每个客户创建一个文件夹,或者为每个财季创建一个。这就是你的电子文件柜。

在文件夹内,你可以创建一个表格。把它想象成针对特定类型文件的电子表格模板。比如为收据创建一个表格,你可以定义 商户名称日期总金额 等列。这个设置只需做一次。之后,你拖入该表格的每一张收据都会被自动处理,提取出的数据会作为一个新的、井井有条的行被添加进去。

一次性定义好列,然后上传文件。每个文件都会成为表格中结构化的一行。

这样,一个混乱的过程就变成了一套例行公事。一百张收据不再是一百个需要管理的文件,而是同一个表格里一百条格式一致的记录。你甚至可以拖入一个多页的PDF文件,每一页都会成为独立的一行。

当然,自动提取的数据必须值得信赖。如果系统将总金额识别为 2,045,你怎么知道它是否正确?只需点击那个单元格。工具会立即在原始文件图像上高亮显示它找到该数字的确切位置,让你眼见为实。如果发现错误,你可以直接在单元格里输入来修正。你手动输入的内容将始终覆盖OCR识别的值。

全局搜索可以找到你所有文件中的任何内容,并直接带你到对应的单元格。
✓ Verified

每个提取出的数值都有页面原文可供审计追溯。系统的语言模型会建议文本,但最终的坐标是通过将文本与页面OCR识别出的符号进行逐字匹配来确定的。每个数值都会得到一个 match_ratio 分数;0.85或更高的分数表示匹配的可信度很高。这一交叉验证步骤确保了位置数据是基于源图像的,而不仅仅是语言模型的猜测。

这个系统专为实际应用而设计,定价模式也同样务实。它采用简单的按量付费模式,每张扫描图像 $0.05。你每月的前100次扫描是免费的,如果OCR扫描因任何原因失败,我们不会收取任何费用。浏览文件夹、查看表格或导出数据都是免费的。

对于用量较大的用户,我们提供固定费用的套餐。免费版包含3个表格和1GB存储空间。入门版则扩展到10个表格和10GB存储空间,大约足够每月处理400次扫描。而专业版提供无限表格、100GB存储空间,每月大约可处理1100次扫描。

  1. 创建你的第一个文件夹
    在你的工作空间里,新建一个文件夹。可以根据客户、项目或时间段(如“第三季度发票”)来命名。
  2. 创建一个表格
    在文件夹内,新建一个表格。它将用于存放特定类型的文件,比如收据或工单。
  3. 定义你需要的列
    设置你想要抓取的数据列。例如,对于发票表格,你可以添加“供应商”、“发票号码”、“日期”和“总金额”等列。
  4. 上传你的文件
    将你的扫描图片或PDF文件拖放到表格中。每个文件都会被处理,并作为新的一行出现,对应的列也会被填充好。
  5. 核对一个数值
    点击新行中的任意单元格。原始文件的图像会随之显示,并高亮出相应区域,让你能即时核对提取的数据。
  6. 找到你需要的内容
    使用顶部的全局搜索栏来查找任何文件。输入供应商名称或发票号码,系统会直接带你到正确的表格和单元格。
如果OCR识别错了怎么办?
你可以直接在表格的单元格里编辑。点击单元格,输入正确的值,你输入的内容就会覆盖自动识别的结果。原始的OCR数据会被保留,但显示和导出时会使用你修正后的数据。
可以上传我现有的PDF文件吗?
可以。网页应用支持PDF文件。当你上传PDF后,系统会自动将每一页渲染成图像并进行OCR处理,然后将每一页作为新的一行添加到你的表格中。
如何从space-ocr导出我的数据?
你可以随时将任何表格导出为CSV文件。文件采用带BOM的UTF-8编码,因此在Microsoft Excel、Google Sheets和其他软件中都能正常打开,不会出现乱码问题。
“一次扫描”是怎么计算的?
一次扫描对应处理一个图像文件,或一个PDF文件中的一页。一个10页的PDF文件就算作10次扫描。
我需要注册包月套餐吗?
不需要,你可以选择按量付费。如果你的用量增加,可以选择升级到包月套餐,如入门版($19/月)或专业版($49/月),以获得更多存储空间、更多表格和更大的每月扫描额度。
这个系统只能用于收据吗?
不是的,它适用于任何类型的文件。你可以为发票、名片、采购订单、医疗表格或任何需要提取和组织结构化数据的文件创建表格。

准备好整理你的文件了吗?

立即开始构建你的电子文件柜。每月前100次扫描免费。