生成AIが文脈を理解する「サテライトAI・簡単AI-OCRサービス」
従来のOCRは機械学習などで膨大なデータを学習させることで精度向上を実現している。そのため、導入コストが大きい、満足な結果を出すためには学習データを用意しなければならないといった課題があった。導入してみたものの期待するほどの精度が出ず業務活用ができなかった、実用的な精度を出すまでの時間・手間が大きすぎて本格導入を見送ったということは少なくないようだ。
ここで紹介する「サテライトAI・簡単AI-OCRサービス」は、先述した課題を解消すべく、サテライトオフィスが提供を開始したものだ。生成AIサービス群「サテライトAI」の新しいサービスとしてリリースされ、事前に学習データを用意することなく、簡単に利用開始できる。さらに1枚あたり40円という低コストで利用できるのが大きな特徴だ。
OCRに生成AIを利用する意義は、意味や文脈の理解にある。たとえば「領収書」「5,000円」という文字があったとき、機械学習型では1文字ずつを画像として読取り、合致する文字を出力する。しかし生成AIならば「領収書」を読み取った時点で、領収書ならば日付と金額があるはずだという推測をもって画像内からの読み取りを行う。このおかげで、導入が容易なうえに精度の高さも保証される。
サテライトAI・簡単AI-OCRサービスは、Googleが提供するGeminiを利用してこれを実現している。もちろん、ほかのサテライトAIシリーズのサービスと同じく、業務データはAI学習に利用されないようになっており、情報漏えいのリスクに対応されている。
バッチ処理にも対応し、ローカルプログラムがCSVファイルを生成
サテライトAI・簡単AI-OCRサービスの大きな特徴が、ローカル実行型のプログラムであることだ。生成AI型というとブラウザ経由で書類をアップロードして読み取らせなければならないというイメージがあるかもしれないが、ローカル保存したファイルを直接読み取ることができる。
手動で都度利用することもできるが、バッチ処理に対応するのもポイントだ。週末や月末など決まった日付の夜間などに指定フォルダ内にある画像の一括処理をさせられる。利用時のログインも不要で、Windowsのタスクスケジューラなどプログラムを指定実行するツールを使うだけで毎月の経費精算業務の自動化といった定型業務の効率化ができる。
ローカル実行であるため、社内で各自が自分のPCで利用することも可能だ。具体的にどのフォルダにあるデータを読み込むのか、何日に実行するのかなど細かな設定も各自で行うできるため、業務と希望に合わせた使い分けもしやすい。出力結果はCSVファイルになる。Excelやスプレッドシートで扱えるのはもちろん、経費システムや基幹システムなど各種システムとも連携させやすいだろう。
定義ファイルとプロンプトで多彩な書類も柔軟に読み取り
読み取り対象にはPCで作られた印字データだけでなく、手書きも含まれる。書式の固定されていないフリーフォーマットの書類にも対応可能だ。海外からの請求書で英語表記の場合も問題なく読み取れるし、読み取り時に自動翻訳させることもできる。
これを実現しているのが、定義ファイルとプロンプトの組み合わせだ。定義ファイルは請求書用、領収書用といった書式ごとに作成する。そして、実行時にどのフォルダにあるファイルを、どの定義ファイルを利用して読み込むのか、読み取ったあとでどうして欲しいのかをプロンプトで指定する。
たとえば、「領収書フォルダを毎月20日の夜に領収証定義ファイルを使って処理し、英語文書の場合には翻訳して併記する」というように指定するわけだ。「異なる会社名でも親会社と子会社なので1社の請求書として扱う」「但し書きが特定のものである場合は消費税をつけない」といった指示もできる。
各種書類でとくに多く扱うことになる日付についても日付・発行日・YYMMDDのすべてを同一項目として扱うといった処理もできる。住所の「1-1」といった表記が日付に誤認されるなど、書式と内容の組み合わせで同じミスが多発する場合には、「この項目に対しては、住所として処理をする」と指定すればいいわけだ。
自社作成書類などフォーマットが整った書類ならば、定義ファイルとプロンプトの組み合わせでかなり正確な読み取りが期待できる。一方、クセのある書式で読み取り精度が低い場合には専用のフォルダや定義ファイルを用意し、専用のプロンプトを書いて精度向上を狙ったチューニングをすればいい。
プロンプトは日本語で書けるため、導入段階や新規フォーマットの書類を扱うときに試行錯誤しやすい。機械学習型とは違って使い込むほどに自動的に精度向上するという仕組みではないが、プロンプトで細かな指示を与えることで改善していける。人間に教えるのと同じように、注意点や希望を伝えることで利用者に合った仕様にカスタマイズすることができる。
十分な精度と使いやすい修正ツールで期待を裏切らない業務効率化を実現
仮に固定フォーマットの書類だけを扱い、高い精度を求めなければならないなら、機械学習型OCRの方が向いているかもしれない。しかし、多彩なフォーマットに柔軟に対応するならば生成AI型OCRが向いている。
元々、印字品質や汚れ、手書きのクセなど書類の状態に読み取り精度は影響されるもので、どんなに高価格なOCRでも読み取り精度を100%にすることは難しい。必ず確認と修正作業は発生する。それならば、一定の精度が期待でき、修正しやすい仕組みがある方が扱いやすい場合は多いだろう。
サテライトAI・簡単AI-OCRサービスでは、プロンプトで指定することで、領収書の日付と金額のような必須項目が上手く読み取れなかった場合に空欄にするのではなくエラーと表記することも可能だ。
結果の確認と修正は、ブラウザ上で利用できる修正ツールで行う。元書類の画像データと読み取り結果が1画面に表示されるため、小さな視線移動で確認・修正が可能だ。紙を見て手作業で入力するのに比べると、かなりの効率化になる。さらに修正は元CSVファイルを直接操作しているため、修正後に改めてデータを書き出す必要もない。
OCRの目的は、書類の文字を正確に読み取ってデータ化することだ。できる限り高精度を求めたいのは当然だが、最終確認が必須であるため100%を目指す意味はあまりない。サテライトAI・簡単AI-OCRサービスは、生成AIによる簡易な指示で柔軟な対応をしてくれる。この特徴を活かすことで、“期待を裏切らない業務効率化”が実現できるのではないだろうか。
月500枚まで2万円!充実の導入支援で即座に使えるOCR
サテライトAI・簡単AI-OCRサービスは、生成AIによる柔軟さと十分な精度に、ローカル実行による手軽さと安全性を備えている。従来の機械学習型OCRからの乗り換えや、初めてOCRの導入を検討したい企業、そのどちらにも最適なサービスといえる。
さらに、コスト面でのメリットも大きい。まず、ランニングコストは、月あたり500枚までの読み取りを2万円(税別)で提供。1枚あたり40円の換算だから、試験的に使い始める場合でもハードルが低い。枚数が不足する場合には500枚単位で追加可能だ。
導入支援も充実している。ユーザー環境へのインストールだけでなく、入力書類のOCR解析検証支援やプロンプト設定、項目定義設定支援、QA対応といった、実際に使い始めるまでの準備をサテライトオフィスが支援する。初期費用として30万円(税別)が設定されているが、実際は無償になることが多いという。
サテライトオフィスではトライアルと検証を重視しているため、無償トライアルと企業から提供されたサンプルデータを用いたデータ検証、プロンプトの叩き台作成といった導入支援は、基本サポートの範囲に含まれる。そのため、想像以上に低コスト、かつ容易な導入が実現できる可能性が高い。
「手動入力で毎月何時間もの作業が発生している」「既存OCRで満足できる結果が得られなかった」という場合には、是非サテライトオフィスに相談してみてはいかがだろうか。
サテライトオフィス
■AI関連/クラウド関連に特化したインターネットソリューションベンダー■
さまざまなビジネスモデルに最適なソリューションパッケージを開発し、ユーザー目線に立った戦略の企画・提案を行っています。業界トップクラスの導入実績を持つGoogle WorkspaceやMicrosoft 365、LINE WORKS、ChatGPT など、AI関連ならびにクラウドコンピューティングに関わるビジネスの可能性を追求しています。
●●無料活用セミナー 随時開催中!!●●
提供:サテライトオフィス
[PR]提供:サテライトオフィス




