パナソニック ソリューションテクノロジーはOCRソフト開発キット「カラーOCRライブラリー」シリーズにおいて、新たなロジックを取り入れた「帳票キーワード認識ライブラリー」を発売する。Windows版は19日より、iOS版、Android版、Linux版はそれぞれ6月30日から。

帳票の基点とキーワードをベースとした認識技術概要(同社資料より)

撮影したデータからテキストへと変換してくれるOCR。手書きの文字や撮影した写真などから"文字"を抽出してくれる便利さはWebサービスや名刺をスキャナーで活用するなどその利用法も様々だが、スマートフォンのビジネス活用への期待はさらに広がっている。とくに、公共サービスや企業内では多種多様な帳票が用いられており期待は高いが、従来のエンジンでは保険証券や公共料金の伝票など罫線のないもの、背景色が複雑なものなど罫線抽出が難しい帳票には適さなかったという。

同社は今回、罫線情報でフォーマットを認識する従来のロジックを刷新、帳票中の基点とキーワードをベースに認識対象文字列の位置を特定する技術を開発した。これにより罫線に関する制約がなくなり、納税書類や保険証券など罫線の無い定型帳票の文字認識が可能になった「帳票キーワード認識ライブラリー」の発売を発表している。

例として営業先で顧客の保険証書をタブレットやスマートフォンで撮影、契約を変更した場合に受け取り可能な保険金をアプリケーションで自動シミュレーションするなど、ソフトウェアやクラウドへとスムーズな連携が期待できる。また、複合機やスキャナーのない外出先でもオフィスに戻ることなくその場で撮影・登録することで直行直帰やテレワーク推進に寄与する。

複雑な帳票からのOCR認識例(同社資料より)