Preferred Networks(PFN)、さくらインターネット、情報通信研究機構(NICT)の3者は9月18日、国産生成AIのエコシステム構築を目指すことで基本合意を締結した。

昨今、生成AIはさまざまな分野で活用が進み、将来的な国家や社会の競争力の源泉とみなされつつあるが、悪意を持った利用、悪意がなくとも意図せずにヘイトスピーチなどの不適切な出力がなされる可能性、さらにはAIエージェントなど制御不能な暴走といった懸念やリスクが顕在化しつつあるという。また、こうした課題への対応と併せて、日本の文化や制度が充分に考慮されている生成AIへの期待も高まってきている。

今回の3者の取り組みでは、こうした懸念点に対して、日本の文化や社会等に留意した高品質かつ大量の学習データを用いた安全で高性能な国産LLM(大規模言語モデル)の開発と、そのサービス化を実施。

また、それらを通じて、日本社会と調和しつつ、日本全体の生産性を向上させることのできる国産生成AIに関する学習データの収集、クリーニング、構築から生成AIの学習、チューニング、サービス提供・実活用まで含めたエコシステムを構築することを目指す。

具体的な施策の概要

具体的に、PFNは2026年春に向けて同社がフルスクラッチ開発した国産LLMの「PLaMo 2.0」の後継となるLLM群をNICTと共同で開発。PFNが独自に構築した日本語データを多く含む大量の合成学習データやWebデータに加え、NICTが独自に収集・構築したWebページやインストラクションデータなどを学習に用いることで、日本語性能に優れ、日本の文化、習慣、法制度等への理解を高めた生成AIの開発を進めていく。

さくらインターネットは、フルマネージドの生成AI向け実行基盤「さくらの生成AIプラットフォーム」において、選択可能な基盤モデルとしてNICTとPFNが共同開発するLLMを提供する。これにより、利用者はクラウド基盤からアプリケーションまで、完全に国内で完結した生成AIの活用が可能になる。日本発の技術を活用し、安全かつ信頼できるAI基盤の利用を実現するという。

さらに、今回の取り組みではLLMをさくらの生成AIプラットフォーム上でサービス化し、NICTのAI評価基盤の商用化に向けた検討・実証を進めるとともに、パートナーとの協業を通じて多様な人材が活躍できる新たな機会を生み出し、地域の活性化にもつなげるとのこと。

これらの活動を通じて、データのインプットからアウトプットまでを一貫して整備し、日本企業や官公庁が安心して利用可能な信頼できるAIプラットフォームの提供を目指す。加えて、日本語特有の表現や背景事情を反映したデータ作成・活用をさせることで、日本に根差した信頼性の高い生成AIの実現化を推進していく考えだ。

NICTは、2008年から独自に収集している700億ページを超える日本語Webページを活用するとともに、PFNと共同開発するLLMやNICTが独自に開発したLLM、さらにはこれまでに開発した動作原理の異なるAIなどを組み合わせ、信頼性・創造性・多様性に富んだAI複合体を開発する。

加えて、AI複合体を用いて、どの程度日本文化に沿った回答がなされるか、ハルシネーションが発生するかなどを動的に評価し、弱点を改善するための学習データを自動生成できる能動的評価基盤を開発していく。

これらは問題のある生成AIの特定、改善に役立つほか、国産生成AIの能力向上に貢献するという。NICTは、これらの技術の研究開発を通して、日本におけるより安心安全で日本社会と調和した生成AIの開発、普及、さらには日本全体の生産性向上に向けた活動を推進していく方針だ。