comparison

Amazon Textract の代替をお探しですか?

Amazon Textract の代替を選ぶべき場面を、事実検証済みの公平な視点で解説——値ごとに検証可能な座標、CJK(日本語・韓国語・中国語)対応、クエリ可能なシート、明朗な料金、AWSのセットアップ不要——を、ライブデモで実証します。

8 分で読了· 2026-06-25

Amazon Textract は実力のある成熟したOCRサービスで、英語の書類を大規模に処理するAWSネイティブなパイプラインなら、妥当な既定の選択肢です。しかし「実力がある」ことと「あなたの業務にちょうど合う」ことは別物であり、いくつかの現実的な制約が人々に Amazon Textract の代替を探させます。

  • CJK非対応。 Textract の印刷テキスト・フォーム・テーブルの各機能は、ラテン文字系の一群(英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語)を対象とし、手書き、請求書・領収書(AnalyzeExpense)、身分証(AnalyzeID)、Queries は英語のみです。日本語・韓国語・中国語はリストに入っていません。
  • AWSへの引力。 利用にはAWSアカウント、IAM、SDK、対応リージョン、そしてたいていはS3が必要です——画像を送ってフィールドを受け取りたいだけなら、これは実質的なセットアップコストです。
  • 機能を重ねるページ単位の料金。 料金はページ単位で、呼び出す機能(プレーンテキスト/フォーム/テーブル/クエリ/エクスペンス)によって単価が変わり、機能を組み合わせるとコストが積み上がります。
  • 値ごとのレビューUIが組み込みでない。 Textract は信頼度スコアを返しますが、人手による確認(human-in-the-loop)は自分で組み込む別のサービス(Amazon Augmented AI / A2I)です。

このガイドは公平な比較です——Textract が強い場面と、space-ocr のような代替が合う場面——そして、信じるしかない機能一覧ではなく、実際に確認できるライブデモから始めます。

まずは証拠から:あなたが確認できる抽出結果

ほとんどのOCRベンダーが目の前に出したがらないただ一つのもの。それは、すべての値が、ページ上のどこから読み取られたかを正確に指し示す抽出結果です。下のフィールドにマウスを合わせてみてください——領収書上の枠がその値の読み取り位置であり、各値には、実際にページ上でどれだけ見つかったかを示すマッチ率が付いています。

Source receipts with extracted-field bounding boxes
Verified fields
KINSHO · 合計 2,045
ライフ · 合計 4,286

Every value carries a verified on-page location — bbox + 4-point vertices + match_ratio — on a 0–1000 normalized grid (0,0 top-left → 1000,1000 bottom-right), the same shape the live API returns. Hover a field to trace it back to the pixels it came from.

Demo抽出された各フィールドは、それぞれ独自のバウンディングボックスと<b>マッチ率</b>を持ちます——単なる値ではなく、ページ上のどこに存在し、どれだけよく一致したかまで分かります。
抽出された各フィールドは、それぞれ独自のバウンディングボックスとマッチ率を持ちます——単なる値ではなく、ページ上のどこに存在し、どれだけよく一致したかまで分かります。

Textract の代替を評価するときに比べるべきこと

どちらのツールも書類を読み取り、座標付きの構造化データを返します。違いは、値をどうやって検証するか、どの言語に対応するか、データがどうやってツールの外に出るか、そして始めるのにいくらかかるか、にあります。下の表は両者の検証済みの事実を並べたものです——ご自身のワークロードのチェックリストとしてお使いください。

機能Amazon Textractspace-ocr
バウンディングボックスあり——ブロックごとに0〜1正規化の BoundingBoxPolygonあり——値ごとに0〜1000正規化の bbox と回転対応の vertices
値ごとの信頼度ブロックごとの認識信頼度(%)match_ratio——その値の文字のうち実際にページ上で見つかった割合——に加えて bbox_source ラベル
値ごとのレビューUIが組み込みTextract 自体にはなし。人手確認は別サービス(Amazon A2I)アプリに組み込み——セルをクリックすると、その正確な領域が元画像上で光る
領収書・請求書フィールドAnalyzeExpense(別API)、英語のみtemplateIdreceiptinvoice、または独自フィールドを、対応言語で
明細行AnalyzeExpense の明細行(ITEM / QUANTITY / PRICE)children を持つ array フィールド。各セルが個別に位置付けられる
日本語・韓国語・中国語記載なし(ラテン文字系6言語。Expense/ID/手書きは英語のみ)一つのエンジンが日本語・韓国語・中国語・英語などを自動判定
クエリ可能なストレージ結果は自分で保存・クエリ保存済みシートを GET /viewwheresortselect)でサーバー側からクエリ——再OCRも追加料金もなし
CSVエクスポートJSONから自分で組み立てるワンクリック——UTF-8 BOM、明細行は展開済み
料金モデルページ単位、機能ごとに課金。機能を組み合わせるとコストが積み上がる。さらにAWSアカウント前提一律 1枚あたり¥10(約$0.05)。無料枠は月100スキャン、カード不要。Pro は月額$39
セットアップAWSアカウント + IAM + SDK、リージョン依存サービス、たいていS3Bearerキー1本でHTTPSを1回呼ぶだけ。Claude Code プラグインもあり
✓ Verified

「検証可能」について:座標はモデルの言い分を鵜呑みにしていません。 言語モデルは各フィールドのテキストと、どの単語トークンを使ったかのヒントを返しますが、ボックスそのものは決して返しません。エンジンはそのテキストを、ビジョンOCRがページ上で実際に検出したシンボルと文字単位で照合します。だからこそボックスは、それらの文字が見つかった実際のピクセルに配置され、各値にはどれだけ照合できたかを示す match_ratio が付与されます(0.85以上で確実にマッチしたものとして扱います)。モデルのトークンヒントはノイズを含むことがあり——繰り返し行の間で取り違えることがあります——そのため鵜呑みにするのではなく、列・行の整合性チェックで検証します。要点は、AIが間違えないということではなく、すべての値がページと照合され、どれだけ一致したかを示すスコアが付くということです。

Textract のほうが優れている場面

公平な比較は、既存勢が勝つ場面を名指しします。次のような場合は Textract を選んでください。

  • すでにAWSに深く根を張っており、運用中のIAMやSNSとともに S3 → Lambda → Textract に組み込めるOCRが欲しいとき。
  • 書類が英語/ラテン文字系で、フォーム・テーブル・クエリを超大規模に処理する必要があるとき。
  • 自社の書類タイプで学習したカスタムアダプターや、AWSネイティブなコンプライアンス・データレジデンシーの保証が欲しいとき。

これに当てはまるなら、Textract はよく合っており、代替に乗り換えても得られるものはわずかです。

代わりに space-ocr が合う場面

Textract の代替が本領を発揮するのは、次のいずれかが重要なときです。

  • 日本語・韓国語・中国語の書類を処理する。 space-ocr はCJKとラテン文字系を一つのエンジンで処理し、言語は自動判定します——設定する言語パラメータはありません。
  • 信じるのではなく、検証したい。 すべての値が、ページ上のボックスと match_ratio とともに返り、セルをクリックすればどこから読み取られたかが正確にハイライトされます——監査は別途組み込むサービスではなく、最初から備わっています。
  • ストレージを立ち上げたくない。 結果はサーバー側でクエリできるシート(GET /view)に入り、ワンクリックでCSVにエクスポートできます——データベースもAWSアカウントも不要です。
  • 予測できる料金が欲しい。 一律1枚あたり¥10、カード不要の月100スキャン無料枠、そして月額$39のProプラン——機能ごとにページ料金が積み上がることはありません。
  • Claude で開発する。 2行で済むClaude Code プラグインと、依存ライブラリ不要のPythonクライアントがあります。

呼び出し全体がHTTPリクエスト1回です——SDKは不要で、エンジン向けのPDF前処理も不要です(エンジンはラスター画像を受け付けます:JPEG、PNG、GIF、BMP、TIFF、WebP)。

請求書を抽出する——リクエスト1回、Bearerキー、AWS不要
1
2
3
4
5
6
7
8
curl -s https://api.space-ocr.com/ocr/fields \
  -H "Authorization: Bearer $SPACE_OCR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "image": "https://example.com/invoice.jpg",
    "imageType": "url",
    "templateId": "invoice"
  }'

各値は、bbox(0〜1000グリッド上の { xmin, ymin, xmax, ymax })、傾いたスマホ写真に沿う回転対応ボックスのための4つの verticesmatch_ratio、そして bbox_source とともに返ってきます。座標モデルの全体像はバウンディングボックス付きOCR APIを、非同期・Webhook主導の側面は請求書データ抽出APIガイドをご覧ください。

Demoどのセルをクリックしても、対応する領域が元画像上で光ります——Textract が別サービスに委ねている、値ごとの検証です。
どのセルをクリックしても、対応する領域が元画像上で光ります——Textract が別サービスに委ねている、値ごとの検証です。

言語:最もはっきりした分かれ目

書類が日本語の領収書、韓国語の請求書、中国語のフォームなら、たいていこれが決め手になります。Textract の印刷テキスト・フォーム・テーブルの各機能はラテン文字系6言語に対応し、手書き、AnalyzeExpense、AnalyzeID、Queries の各機能は英語のみで——日本語・韓国語・中国語は対応リストに入っていません。space-ocr は複数の文字体系を一つのエンジンで正規化し(全角・半角、ハイフンの異体、CJKの字間、縦書き漢字、混在文字)、言語を自動判定するため、渡すヒントはありません。

料金:機能ごとのページ課金 vs. 1枚あたりの一律料金

Textract は、機能によって単価が変わるページ単位の従量課金です——プレーンテキスト検出はフォーム、テーブル、クエリ、AnalyzeExpense とは別に課金され、1ページで複数機能を呼び出すとコストが積み上がります——しかもすべてAWSアカウントの上にです。space-ocr は、いくつフィールドを取り出しても一律 1枚あたり¥10(約$0.05)で、カード不要の月100スキャン無料枠があり、Pro は月額$39で1,100スキャン、チーム共有、100GBのストレージが付きます。抽出に失敗したものは課金されず、保存済みシートへのクエリ(GET /view)は無料です。

Textract の代替として space-ocr を試す手順

  1. キーを取得する——AWSアカウント不要
    無料枠(カード不要、月100スキャン)に登録して spocr_ APIキーを取得します。設定すべきIAMもリージョンもS3もありません。
  2. 画像を送信する
    書類を imageType 'url' または 'base64' で /ocr/fields へPOSTします。エンジンはラスター画像(JPEG、PNG、GIF、BMP、TIFF、WebP)を受け付け、言語は自動判定されます。
  3. テンプレートまたは独自フィールドを使う
    よくあるケースには templateId 'receipt' または 'invoice' を渡すか、独自の fields を指定します——明細行には children を持つ array フィールドを含めます。
  4. 各値を検証する
    各値の bbox、vertices、match_ratio、bbox_source を読みます。アプリではセルをクリックすると、それが読み取られた場所が正確にハイライトされます。0.85 を下回る match_ratio は、よく確認すべき値であることを示します。
  5. クエリまたはエクスポート——ストレージの構築不要
    /upload で画像をシートに投入し、GET /view(where、sort、select)でサーバー側からクエリするか、明細行を展開したCSVをダウンロードします——データベースも再OCR料金もありません。
無料で使える Amazon Textract の代替はありますか?
space-ocr には、クレジットカード不要・AWSアカウント不要の月100スキャンの無料枠があります。それを超えると一律1枚あたり¥10(約$0.05)で、Pro は月額$39で1,100スキャンです。Textract の機能ごと・ページごとのモデルと違い、いくつフィールドを抽出しても料金は変わらず、抽出に失敗したものは課金されません。
space-ocr は、Textract が記載していない日本語・韓国語・中国語に対応していますか?
対応しています。space-ocr は日本語、韓国語、中国語、英語などの文字体系を一つのエンジンで自動判定して処理します——設定する言語パラメータはありません。Amazon Textract の印刷テキスト・フォーム・テーブルの各機能はラテン文字系6言語に対応し、手書き、AnalyzeExpense、AnalyzeID、Queries の各機能は英語のみのため、CJK書類は代替を選ぶよくある理由です。
OCRが抽出した内容はどう検証できますか?
すべての値が、バウンディングボックス、回転対応の4頂点、そして match_ratio——その値の文字のうち実際にページ上で見つかった割合(0.85以上で確実なマッチとして扱います)——とともに返ります。アプリではどのセルをクリックしても、それが読み取られた正確な領域がハイライトされます。Textract では認識信頼度スコアが得られ、値ごとの人手レビューは別サービスである Amazon Augmented AI(A2I)が担います。
space-ocr を使うのにAWSアカウントは必要ですか?
不要です。space-ocr は https://api.space-ocr.com にある独立したHTTP REST APIです。各リクエストはBearerキー1本で認証し(IAMもリージョン選択もS3も不要)、2行で済むClaude Code プラグインと依存ライブラリ不要のPythonクライアントがあります。画像をURLまたはbase64で送れば、構造化されたフィールドがそのまま返ってきます。
space-ocr は AnalyzeExpense のように領収書・請求書の明細行を抽出できますか?
できます。明細行は、1行(説明、数量、単価など)を children で記述した 'array' 型のフィールドとしてリクエストするか、組み込みの 'receipt' または 'invoice' テンプレートを適用します。各セルがそれぞれのバウンディングボックスを保持するため、折り返しや結合された明細行でも追跡でき——しかも AnalyzeExpense と違い、英語に限定されません。

あなた自身の書類で、検証可能な Textract の代替を試す

無料枠——月100スキャン、クレジットカード不要、AWSアカウント不要。すべての値が、ページ上の位置とマッチ率とともに返ってきます。

関連記事