그대로 믿지 않아도 되는 AI OCR
space-ocr는 LLM으로 문서를 구조화한 뒤, 모든 값을 페이지의 실제 OCR 심볼과 대조 검증합니다. 값마다 위치와, 직접 확인할 수 있는 match_ratio가 붙습니다.
AI OCR은 지저분한 문서에 대한 답처럼 들립니다. 영수증이나 세금계산서를 모델에 건네면 깔끔한 구조화 필드가 돌아온다는 거죠. 문제는 모델이 틀렸을 때입니다. 언어 모델은 실제로 페이지에서 읽었든 아니든, 자신 있고 잘 정돈된 값을 돌려줍니다. 그리고 대부분의 도구는 그 차이를 가려낼 방법 없이 그 값을 그대로 건네줍니다.
space-ocr는 더 엄격한 입장을 취합니다. 구조화는 LLM이 하지만, 최종 판단은 맡기지 않습니다. 모델은 각 값과, 자신이 썼다고 보는 word-token ID를 돌려주고, 엔진은 그 값을 Google Vision이 페이지에서 실제로 검출한 심볼과 글자 단위로 대조합니다. 박스로 위치를 잡고, 얼마나 일치했는지 점수를 매깁니다. 그래서 AI는 파이프라인의 일부일 뿐, 그 심판이 아닙니다. AI가 내놓은 모든 값을 직접 확인할 수 있습니다.
AI의 출력을, 검증된 채로 보기
아래 어느 항목이든 마우스를 올려 보세요 — 영수증 위의 박스는 그 값이 페이지에서 실제로 발견된 자리이지, 모델이 주장한 자리가 아닙니다. 여기 있는 값·박스·일치 점수는 모두 실제 파싱 결과에서 읽어온 것으로, 목업이 아닙니다.

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.
space-ocr의 AI OCR 작동 방식
이미지를 올리면 LLM이 문서를 구조화 필드로 읽고, 각 값을 자신이 쓴 word-token ID와 함께 돌려줍니다. 그것이 당신에게 닿기 전에 CharMatcher가 그 값을 받아, 글자를 Google Vision이 페이지에서 검출한 심볼과 대조해 박스·회전 꼭짓점·match_ratio를 만듭니다. 모델이 토큰 ID를 줬다면 엔진은 그 Vision word 박스를 조회해 필드의 source를 token_id로 덮어쓸 수 있습니다 — 다만 반복 값 열에서는 모델의 토큰 힌트가 틀릴 수 있어 열 클러스터링과 행 일관성에 기댑니다.
스키마를 쓸 필요가 없습니다. receipt나 invoice 같은 내장 templateId를 넘기거나, 직접 fields를 정의하거나, autoFields를 켜서 모델이 구조를 제안하게 하세요. 웹 앱은 PDF를 페이지 단위로 먼저 이미지화하고, 공개 API는 래스터 이미지를 직접 받습니다(JPEG·PNG·GIF·BMP·TIFF·WebP).
curl -s https://api.space-ocr.com/ocr/fields \
-H "Authorization: Bearer $SPACE_OCR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"image": "https://example.com/receipt.jpg",
"imageType": "url",
"templateId": "receipt"
}'검증할 수 있는 AI OCR 실행 방법
- 문서 보내기이미지를 /ocr/fields에 보냅니다(url 또는 base64). 앱에서는 PDF를 끌어다 놓을 수 있고 각 페이지가 먼저 이미지화됩니다. 공개 API는 래스터 이미지를 받습니다.
- AI에 구조화 맡기기내장 templateId를 넘기거나, 직접 fields를 정의하거나, autoFields를 켜서 모델이 스키마를 제안하게 합니다. LLM은 각 값과 사용한 word-token ID를 돌려줍니다.
- 검증된 결과 읽기각 값은 bbox·vertices·match_ratio·bbox_source와 함께 반환되며, 페이지 내 모든 필드 위치를 담은 field_bboxes 맵도 제공됩니다 — 페이지와 대조 검증된 AI의 출력입니다.
- 낮은 점수 검증셀을 클릭하면 그 값을 읽어낸 정확한 영역이 강조됩니다. match_ratio가 0.85 미만이면 한 번 더 볼 값입니다. 수정 사항은 원본 OCR 값 옆에 저장됩니다.
- 내보내기 또는 조회CSV(UTF-8 BOM, 품목 펼쳐짐)를 다운로드하거나, 저장된 시트를 GET /view로 where·sort·select를 써서 조회합니다 — OCR 재실행도 추가 비용도 없습니다.
단순하고 예측 가능한 가격
이미지당 ₩100(¥10 / $0.05), 신용카드 없이 월 100회 스캔 무료 플랜 포함. 정액 플랜은 월 스캔 수·시트·저장공간을 추가합니다.