リコーは7月15日、経済産業省と新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内における生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」第3期に採択されたことを発表した。2期連続での採択。
同社はこの事業において、企業の知の結晶であるドキュメント群に対し、多段推論を行うことでより高精度な読み取りが可能なリーズニング性能を持つマルチモーダルLLMの開発を進める。
特に、画像トークンの圧縮技術で省リソースかつ低コストで運用可能なモデル開発と、モデルマージの技術などを活用した効率的な開発プロセスの確立を目指す。
なお、同社は2024年8月から実施されたGENIAC第2期においてLMMの基本モデルの開発を完了しており、7月29日に基本モデルおよび独自に開発したベンチマークツールを無償公開予定。
取り組み内容
紙文書をベースに業務を進めている企業も多い中、リコーは複合機やスキャナなど独自のエッジデバイスを活用して、高精度なデジタル化を支援している。さらに、AIを活用した先進的な画像認識やOCR技術に強みを持つドイツのスタートアップ「natif.ai」をグループ企業に加えるなど、技術力の強化も進めている。
加えて、LMM(Large Multimodal Model:大規模マルチモーダルモデル)によるドキュメントの高度な利活用によって、文書処理に関わる一連の業務を効率化するプロセスオートメーションの実現にも取り組む。
リコーはデジタル技術による業務プロセスの最適化を通じ、単純作業を減らして生産性の向上を実現するとともに、AIやデータの活用によって新たな価値を提供し、ユーザーの創造力の発揮を支援するとしている。
研究開発の例
リコーは今回の事業において、複雑な図表を含む文書画像から情報を抽出、解析して統合的に判断する高いマルチモーダルリーズニング性能の獲得を目指す。また、複雑な図表を含む文書画像のリーズニングタスクにおいて、現在商用利用可能な同等規模のオープンソースモデルの中で最高性能の達成も目指すという。
コストを抑制するための技術開発においては、画像トークンの圧縮技術の開発などでメモリ使用量を抑制し、顧客側の運用コストを削減。マルチモーダルモデルに対するモデルマージ技術などを活用し、開発側の学習コスト削減にも貢献する。