返回结构化字段而不是一堆文字的图像 OCR
用 space-ocr 对 JPEG、PNG 等图像做 OCR:内置模板、明细行、CSV/JSON 导出,每个值都连同它在图像上的框和匹配分数一起返回。
大多数图像 OCR只是丢给你一堆纯文本,然后就没了。你拍一张票据,跑一遍,回来的是一团行,你还得自己去读、去拆、再录进对应的列里。原本在页面上一眼就能看清的结构,没了。
space-ocr 把图像读成结构化字段——店名在这、日期在那、合计在那边、明细是一行行的。并且把每个值连同它在图像上被读取的确切位置一起返回:一个看得见的框,外加一个表示它与像素匹配程度的分数。所以你不必盲信提取结果,而是可以看着照片亲自核对。
看一次你可以亲自核对的真实提取
这是一张图像——拍了两张票据的照片——被读成了字段。把鼠标悬停在下方任意值上,图像上的框就是这个值被读取的位置。这里的每个数字、框和匹配分数,都直接读自一次真实的解析结果,而不是摆拍。

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.
space-ocr 里的图像 OCR 如何工作
把图像以 URL 或纯 base64 发送到 /ocr/fields——JPEG、PNG、GIF、BMP、TIFF、WebP 都会被直接读取。加载时应用 EXIF orientation,所以返回的框与显示出来的照片对齐,哪怕是斜着拿手机拍的也一样。
常见文档不必写 schema。传一个内置 templateId,比如 receipt 或 invoice,或者定义你自己的 fields——明细行用一个带 children 的 array 字段来描述一行。(PDF 走 Web 应用,先把每一页渲染成图片;API 本身读的是图像。)
curl -s https://api.space-ocr.com/ocr/fields \
-H "Authorization: Bearer $SPACE_OCR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"image": "https://example.com/receipt-photo.jpg",
"imageType": "url",
"templateId": "receipt"
}'如何对图像做 OCR
- 发送你的图像把 JPEG、PNG、GIF、BMP、TIFF 或 WebP 以 URL 或纯 base64 发送到 /ocr/fields,或拖进应用。加载时会应用 EXIF 旋转。
- 选择模板或字段传一个内置 templateId,比如 'receipt' 或 'invoice',或提供你自己的 fields——明细行表格用带 children 的 array 字段。
- 读取结构化结果每个值连同它的 bbox、vertices、match_ratio 和 bbox_source 一起返回,还有一个定位图像上每个字段的 field_bboxes 映射。
- 随时核对点击一个值即可高亮它被读取的确切区域;低于 0.85 的 match_ratio 会标记出值得复核的值。编辑会保存在原始 OCR 值旁边。
- 导出或查询下载 CSV(UTF-8 BOM,明细行已展开),或用 GET /view 配合 where、sort、select 查询已存储的表格——无需重跑 OCR,也不额外收费。
简单、可预期的定价
每张图片 $0.05(¥10 / ₩100),含每月 100 次扫描的免费额度,无需信用卡。套餐计划增加每月扫描数、更多表格和存储空间。