space ocr
아티클문서
workspace

디지털 서류 정리, 스캔 그 이상의 체계적인 시스템 구축하기

정리되지 않은 스캔 파일 더미에 파묻혀 있나요? 산더미 같은 디지털 영수증과 인보이스를 폴더와 시트를 활용해 체계적이고 검색 가능한 라이브러리로 만드는 방법을 알아보세요.

6 분 분량· 2026-06-28

스캐너나 스마트폰으로 문서를 디지털화했지만, 컴퓨터 폴더에는 종이 서류가 쌓여있던 책상처럼 어지럽게 파일만 쌓여갑니다. scan_2024-08-17.jpg 같은 이름의 파일을 수십 개씩 열어보며 3개월 전 영수증 하나를 찾는 일, 혹시 익숙하지 않으신가요?

문제는 단순히 종이를 디지털화하는 데 그쳤다는 점입니다. 이미지 파일로 가득 찬 폴더는 디지털로 옮겨온 서류 더미일 뿐입니다. 데이터가 진정으로 유용해지려면, 추출되고, 구조화되고, 검색 가능해야 합니다. 제대로 된 '집'이 필요한 것이죠.

체계적인 작업 공간이 어떻게 작동하는지 보여드리겠습니다. 아래 예시를 직접 사용해보시면 추출된 데이터가 원본 문서와 어떻게 직접 연결되는지 확인하실 수 있습니다. 파일 업로드는 필요 없습니다.

Receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Each value with a box carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

정리를 기다리는 스캔된 영수증
수많은 문서 중 하나일 뿐이지만, 중요한 것은 이 문서가 어디에 저장되고 나중에 다시 찾을 수 있느냐입니다.

해결책은 스캔 파일을 개별 파일이 아닌, 직접 관리하는 데이터베이스의 항목으로 다루는 것입니다. space-ocr에서 작업 공간은 사용자가 직접 만드는 폴더와 시트의 간단한 트리 구조로 이루어집니다. 고객별로 폴더를 만들거나 분기별로 폴더를 만들 수 있죠. 여러분만의 파일 캐비닛인 셈입니다.

폴더 안에는 '시트(Sheet)'를 만듭니다. 특정 문서 유형을 위한 스프레드시트 템플릿이라고 생각하시면 됩니다. 예를 들어 영수증 시트에는 가게 이름, 날짜, 총액과 같은 열을 정의할 수 있습니다. 이 작업은 한 번만 하면 됩니다. 그 후로는 해당 시트에 영수증을 끌어다 놓기만 하면 자동으로 처리되어, 추출된 데이터가 정리된 새 행으로 추가됩니다.

열을 한 번만 정의하고 문서를 업로드하세요. 각 문서는 시트 안의 구조화된 행이 됩니다.

이러한 방식은 혼란스러운 과정을 체계적인 일상으로 바꿔줍니다. 영수증 100장은 더 이상 관리해야 할 100개의 파일이 아니라, 하나의 일관된 표에 담긴 100개의 행이 됩니다. 여러 페이지로 된 PDF 파일을 추가할 수도 있습니다. 각 페이지는 별도의 행으로 자동 추가됩니다.

물론, 자동 추출 기능은 신뢰할 수 있어야 합니다. 시스템이 총액을 2,045로 읽었다면, 그게 정확한지 어떻게 알 수 있을까요? 해당 셀을 클릭하기만 하면 됩니다. 그러면 원본 문서 이미지에서 해당 숫자를 찾은 정확한 위치가 즉시 강조 표시됩니다. 직접 눈으로 확인할 수 있는 것이죠. 만약 실수를 발견하면 셀에 직접 입력하여 수정할 수 있습니다. 수동으로 입력한 값은 항상 OCR 값보다 우선 적용됩니다.

전체 검색 기능으로 모든 문서에서 원하는 값을 찾아 해당 셀로 바로 이동할 수 있습니다.
✓ Verified

추출된 모든 값은 원본 페이지에서 직접 근거를 찾을 수 있는 감사 추적(audit trail)을 거칩니다. 시스템의 언어 모델이 텍스트를 제안하면, 최종 좌표는 페이지의 OCR 기호와 문자 단위로 대조하여 결정됩니다. 각 값에는 match_ratio 점수가 부여되며, 0.85 이상의 점수는 신뢰도 높은 일치를 의미합니다. 이러한 교차 검증 단계는 위치 데이터가 LLM의 추측이 아닌 원본 이미지에 근거하도록 보장합니다.

이 시스템은 실용성을 고려하여 만들어졌으며, 이는 가격 정책에도 반영되어 있습니다. 스캔 이미지당 100원의 간단한 종량제 모델을 사용합니다. 매월 처음 100건의 스캔은 무료이며, 어떤 이유로든 OCR 스캔이 실패하면 비용이 청구되지 않습니다. 폴더를 탐색하거나, 시트를 보거나, 데이터를 내보내는 데에는 비용이 들지 않습니다.

더 자주 사용하시는 분들을 위해 더 많은 용량을 제공하는 정액 요금제도 있습니다. 무료 플랜은 3개의 시트와 1GB의 저장 공간을 포함합니다. 스타터 플랜은 월 약 400건의 스캔에 해당하는 10개의 시트와 10GB로 확장되며, 프로 플랜은 무제한 시트, 100GB 저장 공간, 월 약 1,100건의 스캔을 제공합니다.

  1. 첫 폴더 만들기
    작업 공간에 새 폴더를 만드세요. 클라이언트, 프로젝트 이름 또는 '3분기 인보이스'와 같은 기간으로 폴더 이름을 지정할 수 있습니다.
  2. 시트 만들기
    폴더 안에 새 시트를 만드세요. 이 시트에는 영수증이나 작업 지시서와 같은 특정 유형의 문서가 저장됩니다.
  3. 열 정의하기
    추출하려는 데이터에 맞춰 열을 설정하세요. 인보이스 시트라면 '공급업체', '인보이스 번호', '날짜', '총금액'과 같은 열을 추가할 수 있습니다.
  4. 문서 업로드하기
    스캔한 이미지나 PDF를 시트로 끌어다 놓으세요. 각 파일이 처리되고 열이 채워진 새 행으로 나타납니다.
  5. 값 검증하기
    새로 추가된 행의 아무 셀이나 클릭해 보세요. 원본 문서 이미지가 나타나고 해당 영역이 강조 표시되어 추출된 데이터를 즉시 확인할 수 있습니다.
  6. 필요한 정보 찾기
    상단의 메인 검색창을 사용하여 어떤 문서든 찾아보세요. 공급업체 이름이나 인보이스 번호를 입력하면 올바른 시트와 셀로 바로 이동합니다.
OCR이 값을 잘못 읽으면 어떻게 하나요?
시트의 그리드에서 직접 수정할 수 있습니다. 셀을 클릭하고 올바른 값을 입력하면, 수동으로 입력한 값이 자동 추출된 값을 덮어씁니다. 원본 OCR 데이터는 보존되지만, 표시 및 내보내기에는 수정된 값이 사용됩니다.
기존 PDF 파일도 업로드할 수 있나요?
네. 웹 앱은 PDF 파일을 지원합니다. PDF를 업로드하면 각 페이지가 이미지로 자동 렌더링되고 OCR이 실행되어, 각 페이지가 시트의 개별 행으로 추가됩니다.
space-ocr에서 데이터를 어떻게 내보내나요?
언제든지 모든 시트를 CSV 파일로 내보낼 수 있습니다. 파일은 BOM이 포함된 UTF-8로 인코딩되어 Microsoft Excel, Google Sheets 및 기타 소프트웨어에서 문자 깨짐 문제 없이 정확하게 열립니다.
과금 기준이 되는 '스캔 1건'은 무엇인가요?
스캔 1건은 처리된 이미지 파일 1개 또는 PDF 파일 1페이지에 해당합니다. 예를 들어 10페이지 분량의 PDF는 10건의 스캔으로 계산됩니다.
월간 요금제에 가입해야 하나요?
아니요, 사용한 만큼만 지불하는 종량제 옵션을 사용할 수 있습니다. 사용량이 늘어나면 스타터(Starter, $19/월) 또는 프로(Pro, $49/월)와 같은 월간 요금제를 선택하여 더 많은 저장 공간, 더 많은 시트, 그리고 더 큰 월간 스캔 허용량을 확보할 수 있습니다.
이 시스템은 영수증 전용인가요?
아니요, 모든 문서 유형을 위해 설계되었습니다. 인보이스, 명함, 구매 주문서, 의료 서식 등 구조화된 데이터를 추출하고 정리해야 하는 모든 문서에 대한 시트를 만들 수 있습니다.

서류를 정리할 준비가 되셨나요?

지금 바로 당신의 디지털 파일 캐비닛을 만들어보세요. 매월 첫 100건의 스캔은 저희가 부담합니다.