キヤノンマーケティングジャパン(キヤノンMJ)と人工知能の開発を行うCogent Labsは10月25日、手書きの光学文字認識(OCR)分野において販売代理店契約を締結し、「手書き AI OCRソリューション」を11月より提供開始すると発表した。

「手書き AI OCRソリューション」は、Cogent LabsのAIを活用した手書き文字デジタル化サービスである「Tegaki」と、キヤノンの画像処理技術によるOCR開発キット「Rosetta-Stone-Components」をAPIで連携させることで、紙文書からのエントリー業務全体の効率化を目指すというもの。該当する文字列を自動で検出するため、定型・非定型を問わない多様なフォーマットの紙文書に書かれた手書き文字をデータ化することができる。

サービスのイメージ

具体的には、まず、イメージ処理エンジン「Rosetta-Stone-Components」がスキャンした紙文書のノイズ除去や、罫線の補正、色を白と黒のみにする二値化などの「前処理」を施し、文書データを読み取りやすい状態に補正することで、OCR本来の性能を発揮できる環境を整える。逆に言えば、このような処理を行わないと認識率が20~30%下がることも珍しくないという。

前処理をしていない文字はエッジがぼやけて見える

前処理を施すことで線の輪郭をはっきりと表示

前処理をしていない印鑑登録証明書のコピー

前処理で地紋(背景)を除去したデータ

さらに、同ソリューションにAIの手書き文字認識「Tegaki」を用いることで、実運用上で84~94%の認識率を実現しているという。ディープラーニングによって学習を繰り返せば、継続的に認識率を向上させていくことが可能だ。また、文字単体ではなく、言語モデルから文字を自動修正することもできる。例えば、誤って「マークティング」と読み取った場合でも、前後の文字の関係から自動で「マーケティング」であると判断して修正を加える。なお、リリース時点では漢字約4000文字、ひらがな、カタカナ、英数字を学習済みだ。

認識を実施したユーザー用画面イメージ

同ソリューションでは、顧客の要望に応じてドキュメントのコンサルティングから入力ソリューション、コンテンツ管理ソリューション、出力ソリューションなどを一気通貫で提供可能だ。また、ツールをただ紹介するだけではなく、顧客ニーズに柔軟に対応するシステムを構築していくため、RPAとの連携やBPO業務などの対応もできるという。

ソリューションの料金は「個別見積りの初期費用+月額運用費20万円~」。キヤノンMJは、BPOなどを除くエンタープライズ向けのドキュメントソリューションのみで、2020年までに70億円の売り上げを目指すとしている。