東京大学大学院工学系研究科(東京大学)、スクウェア・エニックス・AI&アーツ・アルケミー、ソニーグループ(ソニー)、NECの4者は9月28日、オンラインによる合同記者会見を開催し、2021年7月より開始している「世界モデル・シミュレータ寄付講座」に関する説明を行った。

同講座は、2021年7月にスクウェア・エニックス・AI&アーツ・アルケミーの寄附により、2026年6月までの最大5年間の期間で東京大学大学院工学系研究科に設置された。今回、新たにソニーとNECの2社が10月より寄附企業として参加する。

「シミュレーション×ディープラーニング」を主軸に「世界モデル」や「言語理解」などの先端トピックを含めた人工知能(AI)に関する講義を実施し、AIに携わる次世代の人材育成および新しいAIの研究開発を4者で協働して推進していく。

  • 左上から、東京大学大学院工学系研究科 教授 松尾豊氏、同研究科 教授 淺間一氏、同研究科 教授 太田順氏。左下から、スクウェア・エニックス・AI&アーツ・アルケミー CTO 三宅陽一郎氏、ソニーグループ VP 藤田雅博氏、NEC 執行役員 山田昭雄氏

【関連記事】
≪少ないデータでAIが作れる技術「スパースモデリング」とは?≫
≪デジタルツイン活用の『次世代AI都市シミュレーター』の研究開始‐東大ら4者≫

「ディープラーニングの研究・社会実装は第2ステージに入ってくる」と、同記者会見に登壇した東京大学大学院工学系研究科 教授の松尾豊氏は語った。同氏は、「AIによる画像認識の技術は確立された。次に大事となるのは、空間の情報を構造化し運動に習熟するAIや、言語の意味理解をするAIだ」と述べた。

それらの実現に大事になってくるのが、2018年から研究が開始されている「世界モデル」と呼ばれる手法だ。世界モデルとは、ディープラーニングによってシミュレーション空間自体を構築するモデルのこと。簡単に言えば、人間の脳内で行われているシミュレーションをAIに置き換えることだという。

  • 東京大学大学院工学系研究科 教授の松尾豊氏

人間は情報欠損や将来の様子を想像で補うことができる。例えば、テーブルからガラスのグラスが落ちたとき、「グラスが砕けて散らばるだろう」と、現在の状況から未来を想像することができる。また、物体の一部を見て全体像を想像することも可能だ。

  • 人間の脳内で行われているシミュレーションをAIに置き換える

しかし、これは先天的に持っている能力ではなく、経験によって学んでいるに過ぎない。「AIも同様に経験から効率的に外界の常識を学び、想像できるようになることが今後の発展の肝だ」と、松尾氏は強調する。その基幹技術となるのが世界モデルということだ。Googleのような先進企業・研究室が世界モデルの研究に注力しているという。

世界モデルが組み込まれた次世代型AIが社会へもたらすインパクトは大きい。「眼」と「想像力」をもった汎用型ロボットが登場し、対話や接客、翻訳、物理・社会の新法則の発見といったホワイトカラーの仕事をAIがこなすようになる。世界モデルを組み込んだ次世代AIができると、浸食される産業の市場規模は莫大であり、かつ、海外企業との垣根もなくなりグローバル競争の激化が予想される。

「世界モデルの構築ができると、ロボットが上手に行動をプランニングすることができ、何をしたら何が起きるかという『想像』をすることができる。言語表現を手がかりに『想像』を行うことが真の意味理解の中心的な機能であると考えている」(松尾氏)

同技術の啓蒙を行い、国内の産業全体に良い影響を与えたいというのが、今回設立される「世界モデル・シミュレータ寄付講座」の狙いだ。「世界モデルの研究を国内で先駆けて行い、世界に伍して戦えるものにしたい。基礎研究、教育、そしてインキュベーションを行っていく」と、松尾氏は展望を示した。

ゲームという仮想空間内で動作するAI研究開発を手掛けているスクウェア・エニックス・AI&アーツ・アルケミーに加え、イメージング&センシング技術やロボティクス技術、ゲーム・音楽・映画のコンテンツ生成・表現技術など、実世界と仮想世界にAI技術を掛け合わせた領域を強みとするソニー、顔認証などの画像認識技術やロボティクス技術などさまざまなAIを開発しているNECの3社と協働し、人材育成および研究開発を推進していく。

なお、2021年度の同講義は、「世界モデルを軸に最新の深層学習技術について身につける」ことを目的とし、2021年冬にオンラインによる開催を予定している。受講対象者は東京大学学部学生・大学院学生で、一般聴講は不可となっている。

  • 「世界モデル・シミュレータ寄付講座」の内容とスケジュール(予定)