国立情報学研究所(以下、NII)と東京工業大学 学術国際情報センター(以下、GSIC)は4月18日、LLM(Large Language Models:大規模言語モデル)の研究開発において連携および協力することを目的とした協定を4月16日に締結したことを発表した。

協定の内容

今回両者が締結した協定では、スーパーコンピュータを用いたLLMの効率的な学習に関する研究、日本語の大規模言語モデルの学習に必要なデータの収と評価、日本語性能の高いLLMの学習にそれぞれ取り組む。

この協定の下で両者は、スーパーコンピュータ TSUBAME 4.0の活用によりLLMの研究を協力して推進し、オープンかつ日本語に強いLLMの構築を通じて生成AIの透明性と信頼性の向上、さらには社会実装を加速化させる取り組みを進めるとしている。

連係の背景

LLMは個人情報の取り扱いや著作権の保護、信頼性の確保といった観点から国民生活のさまざまな場面で課題が生じており、LLMのメカニズム解明による透明性の向上や、安全で信頼できるAIの実現が求められている。

こうした社会背景の中で、NIIでは2024年度にLLMの研究開発センターを設置し、理解と生成の両面で日本語性能が高いLLMの構築と、生成AIの透明性および信頼性の確保に向けた研究開発を実施する体制を整えている。

一方のGSICは2010年にGPUをスーパーコンピュータに導入するなど、多くの利用者に使いやすいGPU計算環境の整備を進めてきた。2024年4月にはNVIDIA H100 GPU 960台からなる国内最大規模のGPUスパコン TSUBAME 4.0の稼働を開始した。

今回の協定締結により、NIIにおいて実施するLLM構築に必要となる学習データの収集や評価、モデル学習をスーパーコンピュータ上で安定的かつ効率的に実施できるようになり、国産LLMの構築と社会実装の加速が期待できるという。