Amazon Textract の代替をお探しですか?
Amazon Textract の代替を選ぶべき場面を、事実検証済みの公平な視点で解説——値ごとに検証可能な座標、CJK(日本語・韓国語・中国語)対応、クエリ可能なシート、明朗な料金、AWSのセットアップ不要——を、ライブデモで実証します。
Amazon Textract は実力のある成熟したOCRサービスで、英語の書類を大規模に処理するAWSネイティブなパイプラインなら、妥当な既定の選択肢です。しかし「実力がある」ことと「あなたの業務にちょうど合う」ことは別物であり、いくつかの現実的な制約が人々に Amazon Textract の代替を探させます。
- CJK非対応。 Textract の印刷テキスト・フォーム・テーブルの各機能は、ラテン文字系の一群(英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語)を対象とし、手書き、請求書・領収書(AnalyzeExpense)、身分証(AnalyzeID)、Queries は英語のみです。日本語・韓国語・中国語はリストに入っていません。
- AWSへの引力。 利用にはAWSアカウント、IAM、SDK、対応リージョン、そしてたいていはS3が必要です——画像を送ってフィールドを受け取りたいだけなら、これは実質的なセットアップコストです。
- 機能を重ねるページ単位の料金。 料金はページ単位で、呼び出す機能(プレーンテキスト/フォーム/テーブル/クエリ/エクスペンス)によって単価が変わり、機能を組み合わせるとコストが積み上がります。
- 値ごとのレビューUIが組み込みでない。 Textract は信頼度スコアを返しますが、人手による確認(human-in-the-loop)は自分で組み込む別のサービス(Amazon Augmented AI / A2I)です。
このガイドは公平な比較です——Textract が強い場面と、space-ocr のような代替が合う場面——そして、信じるしかない機能一覧ではなく、実際に確認できるライブデモから始めます。
まずは証拠から:あなたが確認できる抽出結果
ほとんどのOCRベンダーが目の前に出したがらないただ一つのもの。それは、すべての値が、ページ上のどこから読み取られたかを正確に指し示す抽出結果です。下のフィールドにマウスを合わせてみてください——領収書上の枠がその値の読み取り位置であり、各値には、実際にページ上でどれだけ見つかったかを示すマッチ率が付いています。

Every value carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.
Textract の代替を評価するときに比べるべきこと
どちらのツールも書類を読み取り、座標付きの構造化データを返します。違いは、値をどうやって検証するか、どの言語に対応するか、データがどうやってツールの外に出るか、そして始めるのにいくらかかるか、にあります。下の表は両者の検証済みの事実を並べたものです——ご自身のワークロードのチェックリストとしてお使いください。
| 機能 | Amazon Textract | space-ocr |
|---|---|---|
| バウンディングボックス | あり——ブロックごとに0〜1正規化の BoundingBox と Polygon | あり——値ごとに0〜1000正規化の bbox と回転対応の vertices |
| 値ごとの信頼度 | ブロックごとの認識信頼度(%) | match_ratio——その値の文字のうち実際にページ上で見つかった割合——に加えて bbox_source ラベル |
| 値ごとのレビューUIが組み込み | Textract 自体にはなし。人手確認は別サービス(Amazon A2I) | アプリに組み込み——セルをクリックすると、その正確な領域が元画像上で光る |
| 領収書・請求書フィールド | AnalyzeExpense(別API)、英語のみ | templateId の receipt/invoice、または独自フィールドを、対応言語で |
| 明細行 | AnalyzeExpense の明細行(ITEM / QUANTITY / PRICE) | children を持つ array フィールド。各セルが個別に位置付けられる |
| 日本語・韓国語・中国語 | 記載なし(ラテン文字系6言語。Expense/ID/手書きは英語のみ) | 一つのエンジンが日本語・韓国語・中国語・英語などを自動判定 |
| クエリ可能なストレージ | 結果は自分で保存・クエリ | 保存済みシートを GET /view(where、sort、select)でサーバー側からクエリ——再OCRも追加料金もなし |
| CSVエクスポート | JSONから自分で組み立てる | ワンクリック——UTF-8 BOM、明細行は展開済み |
| 料金モデル | ページ単位、機能ごとに課金。機能を組み合わせるとコストが積み上がる。さらにAWSアカウント前提 | 一律 1枚あたり¥10(約$0.05)。無料枠は月100スキャン、カード不要。Pro は月額$39 |
| セットアップ | AWSアカウント + IAM + SDK、リージョン依存サービス、たいていS3 | Bearerキー1本でHTTPSを1回呼ぶだけ。Claude Code プラグインもあり |
「検証可能」について:座標はモデルの言い分を鵜呑みにしていません。 言語モデルは各フィールドのテキストと、どの単語トークンを使ったかのヒントを返しますが、ボックスそのものは決して返しません。エンジンはそのテキストを、ビジョンOCRがページ上で実際に検出したシンボルと文字単位で照合します。だからこそボックスは、それらの文字が見つかった実際のピクセルに配置され、各値にはどれだけ照合できたかを示す match_ratio が付与されます(0.85以上で確実にマッチしたものとして扱います)。モデルのトークンヒントはノイズを含むことがあり——繰り返し行の間で取り違えることがあります——そのため鵜呑みにするのではなく、列・行の整合性チェックで検証します。要点は、AIが間違えないということではなく、すべての値がページと照合され、どれだけ一致したかを示すスコアが付くということです。
Textract のほうが優れている場面
公平な比較は、既存勢が勝つ場面を名指しします。次のような場合は Textract を選んでください。
- すでにAWSに深く根を張っており、運用中のIAMやSNSとともに S3 → Lambda → Textract に組み込めるOCRが欲しいとき。
- 書類が英語/ラテン文字系で、フォーム・テーブル・クエリを超大規模に処理する必要があるとき。
- 自社の書類タイプで学習したカスタムアダプターや、AWSネイティブなコンプライアンス・データレジデンシーの保証が欲しいとき。
これに当てはまるなら、Textract はよく合っており、代替に乗り換えても得られるものはわずかです。
代わりに space-ocr が合う場面
Textract の代替が本領を発揮するのは、次のいずれかが重要なときです。
- 日本語・韓国語・中国語の書類を処理する。 space-ocr はCJKとラテン文字系を一つのエンジンで処理し、言語は自動判定します——設定する言語パラメータはありません。
- 信じるのではなく、検証したい。 すべての値が、ページ上のボックスと
match_ratioとともに返り、セルをクリックすればどこから読み取られたかが正確にハイライトされます——監査は別途組み込むサービスではなく、最初から備わっています。 - ストレージを立ち上げたくない。 結果はサーバー側でクエリできるシート(
GET /view)に入り、ワンクリックでCSVにエクスポートできます——データベースもAWSアカウントも不要です。 - 予測できる料金が欲しい。 一律1枚あたり¥10、カード不要の月100スキャン無料枠、そして月額$39のProプラン——機能ごとにページ料金が積み上がることはありません。
- Claude で開発する。 2行で済むClaude Code プラグインと、依存ライブラリ不要のPythonクライアントがあります。
呼び出し全体がHTTPリクエスト1回です——SDKは不要で、エンジン向けのPDF前処理も不要です(エンジンはラスター画像を受け付けます:JPEG、PNG、GIF、BMP、TIFF、WebP)。
curl -s https://api.space-ocr.com/ocr/fields \
-H "Authorization: Bearer $SPACE_OCR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"image": "https://example.com/invoice.jpg",
"imageType": "url",
"templateId": "invoice"
}'各値は、bbox(0〜1000グリッド上の { xmin, ymin, xmax, ymax })、傾いたスマホ写真に沿う回転対応ボックスのための4つの vertices、match_ratio、そして bbox_source とともに返ってきます。座標モデルの全体像はバウンディングボックス付きOCR APIを、非同期・Webhook主導の側面は請求書データ抽出APIガイドをご覧ください。
言語:最もはっきりした分かれ目
書類が日本語の領収書、韓国語の請求書、中国語のフォームなら、たいていこれが決め手になります。Textract の印刷テキスト・フォーム・テーブルの各機能はラテン文字系6言語に対応し、手書き、AnalyzeExpense、AnalyzeID、Queries の各機能は英語のみで——日本語・韓国語・中国語は対応リストに入っていません。space-ocr は複数の文字体系を一つのエンジンで正規化し(全角・半角、ハイフンの異体、CJKの字間、縦書き漢字、混在文字)、言語を自動判定するため、渡すヒントはありません。
料金:機能ごとのページ課金 vs. 1枚あたりの一律料金
Textract は、機能によって単価が変わるページ単位の従量課金です——プレーンテキスト検出はフォーム、テーブル、クエリ、AnalyzeExpense とは別に課金され、1ページで複数機能を呼び出すとコストが積み上がります——しかもすべてAWSアカウントの上にです。space-ocr は、いくつフィールドを取り出しても一律 1枚あたり¥10(約$0.05)で、カード不要の月100スキャン無料枠があり、Pro は月額$39で1,100スキャン、チーム共有、100GBのストレージが付きます。抽出に失敗したものは課金されず、保存済みシートへのクエリ(GET /view)は無料です。
Textract の代替として space-ocr を試す手順
- キーを取得する——AWSアカウント不要無料枠(カード不要、月100スキャン)に登録して spocr_ APIキーを取得します。設定すべきIAMもリージョンもS3もありません。
- 画像を送信する書類を imageType 'url' または 'base64' で /ocr/fields へPOSTします。エンジンはラスター画像(JPEG、PNG、GIF、BMP、TIFF、WebP)を受け付け、言語は自動判定されます。
- テンプレートまたは独自フィールドを使うよくあるケースには templateId 'receipt' または 'invoice' を渡すか、独自の fields を指定します——明細行には children を持つ array フィールドを含めます。
- 各値を検証する各値の bbox、vertices、match_ratio、bbox_source を読みます。アプリではセルをクリックすると、それが読み取られた場所が正確にハイライトされます。0.85 を下回る match_ratio は、よく確認すべき値であることを示します。
- クエリまたはエクスポート——ストレージの構築不要/upload で画像をシートに投入し、GET /view(where、sort、select)でサーバー側からクエリするか、明細行を展開したCSVをダウンロードします——データベースも再OCR料金もありません。
無料で使える Amazon Textract の代替はありますか?
space-ocr は、Textract が記載していない日本語・韓国語・中国語に対応していますか?
OCRが抽出した内容はどう検証できますか?
space-ocr を使うのにAWSアカウントは必要ですか?
space-ocr は AnalyzeExpense のように領収書・請求書の明細行を抽出できますか?
あなた自身の書類で、検証可能な Textract の代替を試す
無料枠——月100スキャン、クレジットカード不要、AWSアカウント不要。すべての値が、ページ上の位置とマッチ率とともに返ってきます。