space ocr
文章文档
developer

如何利用 OCR API 和 Webhook 构建应付账款自动化流程

了解如何构建一个可靠的应付账款自动化流程。通过异步 OCR API 上传发票,并使用安全的 Webhook 接收结构化数据。

7 分钟阅读· 2026-06-29

处理发票是典型的业务瓶颈。手动录入数据不仅慢,还容易出错。即使使用了 OCR API,采用轮询方式检查任务是否完成也效率低下,这会增加系统的复杂性、延迟和不必要的网络流量。一个真正自动化的应付账款工作流不应该需要反复查询“好了吗?”,而应是事件驱动的,在数据就绪时立即响应。

一张正在通过应付账款自动化流程处理的发票
输入发票,输出结构化数据和 Webhook 通知。

这就是 space-ocr 异步处理背后的核心理念。您无需发起请求后一直保持连接等待,而是可以上传一批发票后立即处理其他任务。API 会立刻返回一个任务标识符列表,确认文件已收到。我们的引擎随后会处理每张图片。当一张发票成功读取后,一个通知会通过 Webhook 直接发送到您应用程序的端点——这是一个简单可靠的 HTTP POST 请求,其中包含了所有结构化数据。

整个流程非常直接:您只需调用一次 POST /upload 并附上您的发票图片。作为响应,您会得到一个待处理任务的数组。稍后,您的服务器会通过 Webhook 收到一个 ocr.completed 事件。该事件的有效载荷 (payload) 中包含了完整的提取结果,从供应商名称(如“弥生サンブル”)到每个明细项目及其在页面上的对应坐标。为了保证可靠性,每次上传都可以在请求头中包含一个 Idempotency-Key。当您需要重试网络请求时,发送相同的 key 可以确保不会创建重复的处理任务。

webhook-receiver.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
const express = require('express');
const crypto = require('crypto');

// Middleware to get the raw body for signature verification
const rawBodySaver = (req, res, buf, encoding) => {
  if (buf && buf.length) {
    req.rawBody = buf.toString(encoding || 'utf8');
  }
};

const app = express({ verify: rawBodySaver });
const webhookSecret = process.env.SPACE_OCR_WEBHOOK_SECRET;

app.post('/webhook', (req, res) => {
  const signature = req.get('X-Spaceocr-Signature');
  if (!signature) {
    return res.status(400).send('Missing signature');
  }

  const hmac = crypto.createHmac('sha256', webhookSecret);
  const digest = Buffer.from(hmac.update(req.rawBody).digest('hex'), 'hex');
  const receivedSignature = Buffer.from(signature, 'hex');

  if (!crypto.timingSafeEqual(digest, receivedSignature)) {
    return res.status(400).send('Invalid signature');
  }

  // Signature is valid, now process the event
  const event = JSON.parse(req.rawBody);

  switch (event.event) {
    case 'ocr.completed':
      const { result } = event.data;
      console.log(`OCR successful for ${result.name}:`, result.values);
      // TODO: Add structured data to your accounting system
      break;
    case 'ocr.failed':
      const { error } = event.data;
      console.error(`OCR failed for ${event.data.name}:`, error.message);
      break;
    case 'webhook.test':
      console.log('Webhook test successful!');
      break;
    default:
      console.log(`Unhandled event type: ${event.event}`);
  }

  res.status(200).send({ received: true });
});

app.listen(3000, () => console.log('Webhook receiver listening on port 3000'));
✓ Verified

space-ocr 是如何定位页面上的数据的?底层的语言模型在返回提取的文本时,会附带指向其可能位置的 token 提示。随后,我们的引擎会执行一个关键的验证步骤:将提取出的值与页面上实际检测到的 OCR 字符逐一进行匹配。这个过程会生成一个 0.0 到 1.0 之间的 match_ratio(匹配率)分数。分数达到 0.85 或更高则表示匹配的可信度很高。最终的坐标会以 0-1000 范围内的归一化边界框形式返回,与原始图像的像素尺寸无关。

我们致力于让这种自动化技术普及化。通过 API 处理的每张图片统一定价为 $0.05。每个账户每月还享有 100 次免费扫描额度。重要的是,如果 OCR 任务因图像无法识别而失败,我们不会收取任何费用。成本与成功提取数据直接挂钩,这让您能以低风险的方式开始您的应付账款自动化。

  1. 暴露一个公共端点
    您的服务器需要一个公共 URL。在本地开发时,可以使用 ngrok 等服务将您的本地服务器暴露到互联网上。
  2. 注册您的 Webhook URL
    在 space-ocr 控制面板的设置中,添加您的公共端点 URL。安全地复制生成的 Webhook 密钥。
  3. 实现签名验证
    使用我们提供的代码示例,对每个传入请求的 `X-Spaceocr-Signature` 请求头进行验证,以确保其真实性。
  4. 处理 'ocr.completed' 事件
    当一个有效的事件到达时,解析 `data.result` 对象,并将结构化的发票数据传递给您的会计系统或数据库。
  5. 异步上传发票
    向 `POST /upload` 发起一个包含文件的请求。API 将立即返回任务详情,而无需等待 OCR 完成。
  6. 确认事件并监控
    您的端点应快速返回一个 2xx 状态码以确认收到事件。在控制面板中监控投递日志,以便排查任何问题。
如果我的 Webhook 端点宕机了怎么办?
space-ocr 会在长达 6 小时内以指数退避策略自动重试投递。我们会在服务器返回 5xx 错误、408、429 或请求超时的情况下进行重试。投递日志会保留 30 天。
我如何验证 Webhook 请求确实来自 space-ocr?
每个 Webhook 请求头中都包含一个 `X-Spaceocr-Signature`。它包含了请求体的 HMAC-SHA256 签名,该签名使用您的专属密钥生成。您必须在服务器上验证此签名。
我可以在一次 API 调用中上传多张发票吗?
可以。`POST /upload` 端点接受 multipart/form-data 格式,您可以在单次请求中包含多个 `files` 字段。API 会返回一个任务数组,每个文件对应一个任务。
OCR 任务失败会收费吗?
不会。如果 OCR 任务失败,我们会触发一个 `ocr.failed` 事件,并自动退还本次扫描的费用。您只需为成功提取数据的任务付费。
轮询和使用 Webhook 有什么区别?
轮询需要您反复调用 `GET /jobs/{jobId}` 来检查任务是否完成。而 Webhook 是事件驱动的,我们的服务器会在结果就绪的瞬间将其推送到您的端点,这种方式效率更高,并能提供实时更新。
我如何从我的应用程序安全地重试上传?
`/upload` 端点支持 `Idempotency-Key` 请求头。如果您在 24 小时内发送相同的 key,服务器将返回原始的缓存响应,而不会创建重复的任务,从而避免双重处理。

开始自动化您的应付账款工作流

获取您的 API 密钥,每月 100 次免费扫描,立即开始构建。

相关文章