workspace

告别扫描仪后的混乱：为你的电子文件打造一个整理系统

别再被杂乱无章的扫描件淹没。学习如何将成堆的电子收据和发票，转变成一个结构清晰、内容可搜索的文件夹和表格库。

6 分钟阅读· 2026-06-28

你有一台扫描仪，或者只是用手机拍照。曾经堆满办公桌的纸质收据、发票和表格，现在变成了电脑里的一个文件夹。这看似是进步，但当你需要找三个月前的一笔开销时，又回到了原点：逐个打开几十个名为 scan_2024-08-17.jpg 的文件。

问题不在于数字化本身，而在于缺少一个管理这些电子副本的系统。一个装满图片的文件夹，不过是另一个数字化的杂物堆。要让这些数据变得有用，就需要提取、结构化并能随时找到。它们需要一个真正的“家”。

下面是一个结构化工作空间的运作方式。你可以与下面的示例互动，看看提取出的数据是如何与原始文档直接关联的。无需上传文件。

Receipts with extracted-field bounding boxes

Verified fields

KINSHO · 合計 2,045

ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

一张等待归档的扫描收据 — 众多文件中的一份——问题在于它最终会放在哪里，以及你是否能再次找到它。

解决方法是，不要把扫描件看作独立的文件，而是把它们当作你掌控的数据库中的条目。在 space-ocr 中，你的工作空间是一个由你亲手创建的、简单的文件夹和表格树状结构。你可以为每个客户创建一个文件夹，或者为每个财季创建一个。这就是你的电子文件柜。

在文件夹内，你可以创建一个表格。把它想象成针对特定类型文件的电子表格模板。比如为收据创建一个表格，你可以定义 商户名称、日期 和 总金额 等列。这个设置只需做一次。之后，你拖入该表格的每一张收据都会被自动处理，提取出的数据会作为一个新的、井井有条的行被添加进去。

一次性定义好列，然后上传文件。每个文件都会成为表格中结构化的一行。

这样，一个混乱的过程就变成了一套例行公事。一百张收据不再是一百个需要管理的文件，而是同一个表格里一百条格式一致的记录。你甚至可以拖入一个多页的PDF文件，每一页都会成为独立的一行。

当然，自动提取的数据必须值得信赖。如果系统将总金额识别为 2,045，你怎么知道它是否正确？只需点击那个单元格。工具会立即在原始文件图像上高亮显示它找到该数字的确切位置，让你眼见为实。如果发现错误，你可以直接在单元格里输入来修正。你手动输入的内容将始终覆盖OCR识别的值。

全局搜索可以找到你所有文件中的任何内容，并直接带你到对应的单元格。

✓ Verified

每个提取出的数值都有页面原文可供审计追溯。系统的语言模型会建议文本，但最终的坐标是通过将文本与页面OCR识别出的符号进行逐字匹配来确定的。每个数值都会得到一个 match_ratio 分数；0.85或更高的分数表示匹配的可信度很高。这一交叉验证步骤确保了位置数据是基于源图像的，而不仅仅是语言模型的猜测。

这个系统专为实际应用而设计，定价模式也同样务实。它采用简单的按量付费模式，每张扫描图像 $0.05。你每月的前100次扫描是免费的，如果OCR扫描因任何原因失败，我们不会收取任何费用。浏览文件夹、查看表格或导出数据都是免费的。

对于用量较大的用户，我们提供固定费用的套餐。免费版包含3个表格和1GB存储空间。入门版则扩展到10个表格和10GB存储空间，大约足够每月处理400次扫描。而专业版提供无限表格、100GB存储空间，每月大约可处理1100次扫描。

创建你的第一个文件夹
在你的工作空间里，新建一个文件夹。可以根据客户、项目或时间段（如“第三季度发票”）来命名。
创建一个表格
在文件夹内，新建一个表格。它将用于存放特定类型的文件，比如收据或工单。
定义你需要的列
设置你想要抓取的数据列。例如，对于发票表格，你可以添加“供应商”、“发票号码”、“日期”和“总金额”等列。
上传你的文件
将你的扫描图片或PDF文件拖放到表格中。每个文件都会被处理，并作为新的一行出现，对应的列也会被填充好。
核对一个数值
点击新行中的任意单元格。原始文件的图像会随之显示，并高亮出相应区域，让你能即时核对提取的数据。
找到你需要的内容
使用顶部的全局搜索栏来查找任何文件。输入供应商名称或发票号码，系统会直接带你到正确的表格和单元格。

如果OCR识别错了怎么办？

你可以直接在表格的单元格里编辑。点击单元格，输入正确的值，你输入的内容就会覆盖自动识别的结果。原始的OCR数据会被保留，但显示和导出时会使用你修正后的数据。

可以上传我现有的PDF文件吗？

可以。网页应用支持PDF文件。当你上传PDF后，系统会自动将每一页渲染成图像并进行OCR处理，然后将每一页作为新的一行添加到你的表格中。

如何从space-ocr导出我的数据？

你可以随时将任何表格导出为CSV文件。文件采用带BOM的UTF-8编码，因此在Microsoft Excel、Google Sheets和其他软件中都能正常打开，不会出现乱码问题。

“一次扫描”是怎么计算的？

一次扫描对应处理一个图像文件，或一个PDF文件中的一页。一个10页的PDF文件就算作10次扫描。

我需要注册包月套餐吗？

不需要，你可以选择按量付费。如果你的用量增加，可以选择升级到包月套餐，如入门版（$19/月）或专业版（$49/月），以获得更多存储空间、更多表格和更大的每月扫描额度。

这个系统只能用于收据吗？

不是的，它适用于任何类型的文件。你可以为发票、名片、采购订单、医疗表格或任何需要提取和组织结构化数据的文件创建表格。

准备好整理你的文件了吗？

立即开始构建你的电子文件柜。每月前100次扫描免费。

免费开始整理阅读API文档