
OCR(Optical Character Recognition)とは、紙の文書や画像に含まれる文字をデジタルデータへ変換する技術です。
データ入力作業の自動化はもちろん、データをシステムに連携させやすいCSVなどの形で出力することで、その後の業務をスムーズにすることができます。
しかし一方で、「OCRは設定が難しい」「図面などをうまく読めない」といった声も少なくありません。
特に、レイアウトが複雑で可変する帳票や図面、あるいは不定形な手書きのメモなどを含む帳票は、従来型のOCRにとって大きな課題でした。
こうした課題の新たな解決策が、生成AIです。
書かれている情報を正確にデータにし、システム内で使用するといったフローにはOCRが向いていますが、「情報を検索したい」「情報分析やまとめをしたい」などデータの利用方法によっては生成AIが向いているケースがあります。
本稿では、生成AIのRAG技術を活用した帳票内の情報管理と検索の方法について、デモを交えながらご紹介します。
OCRで解決が難しいデータ化の課題
OCRは便利な技術でありながら、いくつかの弱点がありました。
非定型帳票への対応や手書きの読み取りなど、多くの課題はAI₋OCRの登場によって解決されています。しかし、私たちの提供するAI₋OCR「AIRead」も、多くの企業の業務課題を解決してきた一方、下記のような要望にお答えするのは現在のOCR技術では困難でした。
- 図面に書かれた文字を柔軟に読みたい
毎回形が異なる図面、文字の書かれる場所やキーワードが変わる図面の読み取りは正確に読み取ることが困難な場合があります。 - 不定形な手書きメモの情報も読み取りたい
現場での手書きメモは、文字の位置や書き方がさまざまです。そのため、読み取り位置やキーワードを事前に設定する必要がある従来のOCRでは対応しきれない事が多いです。 - 定義設定をせずに読み取りをしたい
正確な読み取りを実現するためには、項目の書き方やレイアウトに応じて定義を事前に作成する必要がありますが、この設定作業がネックとなってしまう場合があります。
これらの理由から、OCR製品の導入を検討していたがニーズに合わず断念し、課題を抱えたままになる企業も少なくありませんでした。
生成AIで実現する簡易OCRとは?
業務効率化を実現する要として注目される「生成AI」は、こうした従来OCRの課題をカバーし、ドキュメント内情報の活用を実現させる可能性を秘めています。
「膨大な資料から必要な情報を抜き出したい」「複数の書類の情報を要約・検索したい」「OCRでは拾いきれない曖昧な表現を処理したい」といった場合には生成AIがひとつの選択肢となります。
- AIによる柔軟な認識
図面に書かれた寸法や記号など、一般的なOCRが苦手とする分野にも対応可能です。 - 定義作成不要
帳票のレイアウトごとの複雑な事前設定が不要です。 - 幅広い対応力
定型的な帳票内容だけでなく、手書きメモや注釈も含めて文字を拾えるため、現場の生の情報を取り込めます。
このように、生成AIは「簡単に試せる手軽さ」と「従来は困難だったデータへの対応力」を両立することができるのです。
生成AIツール「AIRealize」を使った簡易OCR
では、実際に生成AIのRAG技術を活用した簡易OCRの具体例を見てみましょう。
RAG(Retrieval-Augmented Generation)とは、登録された大量のナレッジベースから必要な情報を検索し、その情報を基に新しいテキストを生成することができる技術です。
この技術を使う事で、帳票から読み取った情報を活用することが出来ます。
私たちが提供する、企業・自治体向け生成AIツール「AIRealize」には、参照ドキュメントと回答の生成に関するシナリオを設定することが出来る「MyRealize」機能があります。
今回はこのMyRealizeを使って複数の帳票から情報をうまく提示することが出来るのか、検証結果をご紹介します。
まずはAIRealizeに下記3つの図面付きサンプル帳票をアップロードし、シナリオ設定にはメモ書きの情報も包括的に情報提示をするなど、生成の条件を指定し、MyRealizeを作成しました。
登録したサンプル帳票



MyRealize設定

早速、サンプルを登録したMyRealizeにサンプル帳票の内容に関する質問をしてみます。
メモ書きも情報として拾い、帳票内の情報をもとに選別を行うことが出来ています。

また、サイズの指定やメモ書きに注目するような他の質問を通じても、表内の情報だけでなく、内容を参照して的確な回答が得られることがわかりました。
今回は簡素な図面と指示でしたが、登録する図面や帳票に合わせてシナリオ設定などのプロンプトを変えることで、さらに利用スタイルにあった回答が可能になります。


まとめ
生成AIのRAG技術による簡易OCRは、これまで課題とされてきた「図面」「不定形な手書きメモ」にも柔軟に対応しやすいのが大きな強みです。
誰でもすぐに使える手軽さでありながら、業務効率化を実現するツールとして、大きな可能性を秘めています。
情報を正確にデータ化してシステム内で使用するのか、情報をまとめたい・検索したいのか、二ーズに合わせて生成AIを活用することも一つの手段です。前述のように、データを既存システムと連携したい場合にはOCRによる読み取りが適していますが「既存のOCRの設定はハードルが高い」「帳票内の情報をまとめたい・検索したい」といった課題を抱える方には、生成AIは新たな選択肢となるでしょう。
アライズイノベーションでは、AI₋OCR「AIRead」と生成AIツール「AIRealize」の両方を提供しており、ニーズに合った最適なソリューションのご提案が可能です。
課題をお抱えの方はぜひお気軽にご相談ください。