ソフトバンク、マクロミル、Valright Advisory、日本トータルテレマーケティングの4社は2月13日、経済産業省とNEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)が実施する国内の生成AIの開発力の強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」における「生成AI開発加速に向けた新たなデータセットの構築に関する調査」に、2024年10月に採択されこの調査に係る事業を開始すると発表した。

同事業では、生成AI開発に向けたデータセットの構築、管理および提供の最適な手法を調査する。ニーズのヒアリングや実証などについては、業界をリードする国内の複数の大規模言語モデル(LLM)開発事業者と協力し、実用性の高い大規模なデータセットの構築(約3万人の調査参加者を対象とした100万件程度のQA対話データ)を目指す。

また、調査結果を踏まえて、ガイドラインを整備する他、さまざまな事業創出の可能性についても検討する考えだ。事業の実施期間は2025年10月までの予定。

なお同調査は、データセットの構築、データセットの管理・提供、データセットの利活用の実証、事業化の検討、リポートの作成の流れに沿って実施される。ソフトバンク 執行役員 デジタル社会基盤整備室 室長の丹波廣寅氏は「高性能な生成AIの開発には良質なデータが必要。本事業を通して、質と量をそろえ、安心して利用できるデータセットを構築していく」とコメントする。