国内最大級となるデジタルイノベーションの総合展「CEATEC(シーテック)」。25周年を迎える今回は「Innovation for All」をテーマに掲げ、2024年10月15日~2024年10月18日の4日間にわたって開催された。本稿では、25周年特別企画「AI for All」に出展した理化学研究所による講演「理化学研究所がめざす『AI for Science』~科学研究の革新~」の内容をレポートし、科学研究におけるAI活用の現在地を確認していく。
ノーベル賞でAI関連の研究が連続受賞、気運が高まるAI for Scienceが目指す先
2024年10月15日に、千葉県幕張メッセで開幕したCEATEC 2024では、近年の技術トレンドとしてビジネスや生活・社会に浸透したAIの実装に関する出展・講演が数多く見られた。そのひとつが、AIを活用した科学研究の革新を目指す「AI for Science」を推進する理化学研究所(理研)によるセッション「理化学研究所がめざす『AI for Science』~科学研究の革新~」だ。
開催2日目となる10月16日に行われた本講演では、理化学研究所 科学研究基盤モデル開発プログラム(AGIS) プログラムディレクター/生命機能科学研究センター(BDR) 副センター長の泰地 真弘人 氏と、同 計算科学研究センター (R-CCS) センター長の松岡 聡 氏が登壇。マイナビニュース TECH+編集長の小林 行雄 氏がモデレータを務め、理研が取り組む、科学研究における最新のAI活用について語られた。
「まずはノーベル賞の話から始めなければならないと思います。2024年はノーベル化学賞と物理学賞の両方で、AIに関する研究が受賞されており、我々としても非常に喜ばしく思っているところです」という言葉で講演を開始した泰地氏。特に科学向けのAI開発としてノーベル化学賞を受賞したDavid Baker教授とDemis Hassabis、John Jumper博士による研究は、理研が目指す「AI for Science」に近いものがあると喜びを口にする。
泰地氏は理研が目指しているところを、多様で複雑な世界を計算機を使って理解・制御することと説明する。
「我々の目標としては、計算機を使って、複雑な自然や人工物を理解し、制御していくことをゴールと捉えています。多様で複雑な世界、例えば生命科学の領域は非常に複雑な構造を持っています。人工物でも我々は並列計算機を開発していますが、その性能予測というのはかなり難しく、シミュレーションはできても実際にそれをどのように最適化していくかというところは、まったく自明ではないという状況です。 昨今、自動運転の研究開発が進んでおりますが、そこでも世界や人間行動の複雑さに起因する問題が表面化しています」(泰地氏)
ドメイン固有のマルチモーダル基盤モデルを構築し、人間を超えるような知性を実現する
AIは、シミュレーションと並び、こうした複雑な問題に対処するための汎用的なツールと泰地氏は語り、シミュレーションは「モデルが必要でデータが不要」、AIは「モデルが不要でデータが必要」という、相互的な役割を担っていると話を展開する。
「私たちはこれまでシミュレーションをメインとしていましたが、昨今ではAIが非常に発達してきています。シミュレーションとAIを融合させて科学を推進することが、これからの研究活動の本質になってくるのではないかと考えています」(泰地氏)
理研では、大規模言語モデル(LLM)の発明以降を、知的活動を自動化できる可能性が見えてきた状況と捉えている。「研究活動は知的活動の一番重要な部分であり、さまざまなイノベーションの源泉になっています」と泰地氏。イノベーションの源泉となるような新しい発見を、AIの活用によって成していくことを理研の目標と定め、その実現には汎用的なLLMに加えて、生命科学や材料科学といった科学の各ドメイン固有の基盤モデル(Foundation Model)が必要と語る。
「すでにタンパク質やゲノムモデルなどで成果が上がってきているところです。その最たるものがノーベル化学賞受賞理由のひとつとなった『AlphaFold』で、ブレイクスルーとなる成果だと考えています。これだけでなく、科学のさまざまな分野で大規模な基盤モデルを開発しようという流れが加速している状況です」(泰地氏)
基盤モデルは創発性と均一化を特徴とし、多段の推論や複数の情報を統合した複雑な答を創出することが可能となる。1つのモデルで多くの課題に対応でき、人間のような汎用性に近づけると泰地氏は解説。特に科学研究においてはマルチモーダル(異なる種類のデータを統合・処理)化していくことが重要と話を進める。
「LLMだけでは、人間の言語活動からの学習となるため、人間の知性を大きく超えることは困難です。一方、人間は数値情報や計算を高速に行うことがあまり得意ではなく、そういった部分を組み合わせたマルチモーダルAIのモデルを作ると、人間を超えるような知性に進化できるのではないかと、まだ研究途中ではありますが期待しているところです」(泰地氏)
生命科学分野では、多様な種類のデータを扱い、統合していくことが求められるため、マルチモーダル化は必須といえる。シミュレーションが使えるモデルを作るのは非常に難しく、これまでは統計的な手法でデータをつなげていたが、マルチモーダル基盤モデルを使うことで、予測可能な範囲が大きく拡大すると期待されている。そこで理研は、科学研究基盤モデル開発プログラム「AGIS」を2024年4月から開始している。
「TRIP(最先端研究プラットフォーム連携)プロジェクトの一環として、科学研究のための生成AI開発を目標に掲げたAGIS(科学研究基盤モデル開発プログラム: Advanced General Intelligence for Science Program)を開始しました。その狙いとしては、まずはスケーリングへの対応。日本は大規模なAI開発で若干立ち遅れたところがありますので、AI開発のためのデータ取得を行い、モデルを大きくするのと併行してコンピューティングも高性能化していきます。そこから先ほど話した科学向けのマルチモーダル基盤モデル開発を行い、それを使った実験、及びシミュレーション・解析プロセスの自動化を図ります。この3つがAGISの大きな狙いとなっており、科学的成果の創出、グランドチャレンジ課題の解決を目指しています。AGISの構成としては、科学向けのAI開発は私がリードし、生命・医科学基盤モデル(3テーマ)と材料・物性基盤モデル(2テーマ)の開発を推進。計算基盤はここにおられる松岡さんがセンター長を務める計算科学研究センター(R-CCS)にてプロジェクトをリードし、共通基盤(科学向けLLM/機械学習)は生命機能科学研究センター(BDR)の高橋さんを中心に取り組みを進めています」(泰地氏)
講演では、細胞レベル応答の基盤モデルに関する研究を例に、マルチモーダル基盤モデルの重要性が解説された。さらに理研の取り組みとして「科学用基盤モデルのためのHPC基盤整備・高度化」「次世代AI向けアーキテクチャの探索」「AIによる科学研究の自動化」について言及。科学研究、実験の自動化を実現する、人間向けの実験器具を扱えるロボット“まほろ”や“Ardea”も紹介された。
泰地氏は、AGISにおける国際協力・国際連携の推進について言及した後、理研が見据える今後の目標を次のように語り、松岡氏にバトンを渡した。
「新しい発見をするには、定型的なものを大規模化するのではなく、多様なアプローチを用いて研究することが重要です。そのためには、AIやシミュレーションを使って自動的な実験を行うシステムが必須となり、一部の領域では、すでに『AI科学者』が開発されつつあります。最終的には、いろいろな知識が1つのモデルに統合されたようなもの、例えば複雑な生命システムを複雑なままモデル化して、予測を可能にしたいと考えています。生命科学だけでなく、自然科学や社会科学までを統合し、“学問の再統合”を図ることが究極の目標といえるでしょう」(泰地氏)
次世代スパコンとAI for Scienceの組み合わせが、計算科学に革新をもたらす
続いて登壇した計算科学研究センター センター長の松岡氏は、「『富岳』、その先へ~AIとシミュレーションの融合がもたらす計算科学の革新~」というテーマで講演を行った。
「計算科学研究センターは『計算の計算による計算のための科学』を掲げて研究を続けており、『計算の科学』『計算による科学』『計算のための科学』の相乗効果と融合により、卓越したサイエンスの創出を目指しています。この計算というのは、先ほど泰地さんの話にもありましたが、昔はシミュレーションだけでしたが、最近はAIというのが同じ位置、ないしは、より重要な位置を占めるようになってきています。我々も当然ながら、その研究開発に非常に力を入れているところです」(松岡氏)
計算科学研究センターでは、前述したTRIPの一環としてAI for Scienceプラットフォーム部門を創設。「富岳」Society 5.0 推進拠点 拠点長でもある松岡氏が部門長を務め、AIシフト、データシフトを推進している。多くの人員がAIを使った研究開発、AIのための研究開発に重点を置き、その成果をスーパーコンピュータ「富岳」や次世代の計算基盤につなげていくことをミッションの1つと捉えている。
「『富岳』という名前は、高い計算性能(縦軸)と幅広い応用分野(横軸)の両立を山の形になぞらえているのですが、そのような非常に柔軟性の高いアーキテクチャにもとづいて開発されているため、いきなりAIがやってきても、それなりにAI for Scienceの研究に役立てられています。ただし、いろいろ不足しているところもあるので、次世代の計算基盤システム『富岳NEXT(仮称)』でAI処理を大幅に強化する計画を開始しようと検討を進めているところです」(松岡氏)
すでに現状の「富岳」を使ったLLMの研究は進められている。代表的なものとしては東京科学大学(旧・東京工業大学)の横田理央教授がリードし、さまざまな研究機関が共同開発した「Fugaku-LLM」(2024年5月公開)があげられる。日本語能力に優れた大規模言語モデルであるFugaku-LLMは、「富岳」の性能を最大限に活用した分散並列学習を実現。基盤モデルを科学研究に活用するAI for Scienceを実践し、革新的な研究やビジネスにつなげることが期待されている。
「Fugaku-LLMを作るうえで重視したのは、単にモデルを作るのではなく、基盤モデルの作り方を我々が習得することで、これがもっとも重要でした。日本においては、日本語に特化した基盤モデルの構築を重視しているケースが非常に多いのですが、そこが重要なのではなく、万単位の計算ノードで非常に大規模な基盤モデル、先ほど泰地さんが話された『科学のための基盤モデル』を作ること、その技術を習得することが必要と考え、本プロジェクトを推進しました」(松岡氏)
松岡氏は、科学の最先端でシミュレーションの中心にいた人たちの多くは、すでにAI for Scienceを実践していると現状を分析。「認識」「模倣」「生成」の3つを軸にイノベーションを創出していると話し、AI for Scienceの最終的、究極的な目標を「AIが科学者に置き換わること」と定める。
「泰地さんがAI科学者について話されましたが、科学により新たな発見、イノベーションを創出する“科学のためのAI”は創造性が高くなければならない。人間を超えるような創造性を持ったAIを実現できれば、科学によるイノベーションサイクルが加速し、人類に大きな価値と進化をもたらすはずです」(松岡氏)
講演の後半では、サイバー空間とフィジカル空間を高度に融合させたものづくりなど、AI for Scienceの具体的な実践例が紹介され、シミュレーションとAIを組み合わせることで、新たな価値を創造できることが解説された。さらに松岡氏は、AIハードウェアのトレンドと理研が計画している新たな計算基盤や、その先にある「富岳NEXT」について言及する。
「AIハードウェアのトレンドについてですが、我々の考えではエッジAIがこれ以上高度化するのは難しい。このため高負荷なLLMの推論はIDC(インターネットデータセンター)で行い、エッジでは比較的軽量な計算を行うというのが標準的な使い方になってくると考えています。そうなると電力効率の向上が求められるようになり、『富岳NEXT』のようなゼッタスケールのスーパーコンピュータも、今の『富岳』のような比較的リーズナブルな数十メガワット級のデータセンターでやることが重要になるわけです。AGISでは、『富岳』と連携して複雑な科学研究に対応可能な計算基盤の設計を進めているところです」(松岡氏)
AGISで設計する計算基盤は、AI性能とシミュレーション性能に優れ、それらが密結合して、さらに「富岳」とも結合するようなマシンになると松岡氏。通常のAI学習用のマシンとは異なり、AI for Scienceのためのマシンとして、シミュレーション、AI学習、さらに推論までを考慮しなくてはならず、実現に向けてさまざまな仕掛けを考えているところと解説する。このAI for Science専用計算機は、「富岳NEXT」のプロトタイプとしての役割も担っているという。
「『富岳NEXT』は、2029年度完成、2030年度の運用開始に向けて設計が始まっています。技術革新と持続性/継続性、さらにグローバルで協業しながら我々の人材も固める、いわゆるMade with Japanの3つを柱として、世界をリードするようなAI for Scienceのマシン、すなわち『富岳NEXT』の開発を進めていきたいと考えています」(松岡氏)
AI for Scienceの最前線で活躍する2人が、AI活用の勝ち筋と理研が成すべき役割を語る
セッション後半では、小林氏をモデレータとして、泰地氏、松岡氏の3人によるディスカッションが行われた。
小林氏:泰地先生の話にもありましたが、ノーベル化学賞、物理学賞と連続でAI関連の研究が受賞。これは本講演のテーマとなるAI for Science、科学のためのAIを推進していくにあたり、非常に重要なメッセージになると感じました。あらためまして今回のノーベル賞についての所感をお聞かせください。
泰地氏:物理学賞では、John J. Hopfield氏は物理学者ですが、Geoffrey E. Hinton氏はピュアなAI研究者で、「人工ニューラルネットワークによる機械学習を可能とする基礎的な発見と発明」が物理学賞を受賞したのは正直驚きました。ただし、サイエンスに大きなインパクトを与えたことは確かで、そこが受賞のポイントになったと考えています。
小林氏:科学でAIを使って大丈夫というお墨付きが得られたというのが、今回のノーベル賞が与えたインパクトとも感じられますが、理研においても科学分野でのAI活用を研究するAGISを進められています。理研がこのようなプロジェクトを推進する背景についてお聞かせください。
泰地氏:AlphaFoldが出たときに、AIの知識とドメイン科学の知識を密接に組み合わせると、これだけすごいことができるのかと驚きましたが、同時にどうして我々がこういった成果が出せなかったのかと、大きく反省しました。そして日本国内でこういった研究を行うならば、専門家が揃っている理研がやらなければならないと強く感じました。TRIPという計画自体が、そのような専門家連携のためのプロジェクトといえます。
松岡氏:AIのイノベーションというのは、単に効率化や生産性の向上ではなく、やはり新しい発見を得ることが重要です。それがAI for Scienceであり、その実現に向けて取り組んでいるところです。企業も本当はAI for Scienceをやりたいのですが、AI for ScienceというのはAIの専門家だけではできない。ドメインサイエンスの人と一緒に仕事をして、アルゴリズムはどうあるべきか、マシンはどうあるべきかを、密接に連携しながら進めていかなければなりません。AIをやっている人が、AIだけで閉じこもっていたら、まったく進化がなく、今の日本は海外と比べてそういった傾向が強いと思っています。泰地さんの話にもありましたが、理研というのはそういうことができるところなんです。AGISは理研の取り組みの一部に過ぎず、他にも複数のAI for Scienceのプロジェクトが走っています。将来的には理研全体がAI for Scienceを推進し、科学の在り方を変えていきたい。優れたドメインサイエンティストがいて、優れたマシンがあって、優れたAIサイエンティストがいる理研ならば、海外と比べてAI活用が遅れている状況のなかでも、勝ち筋が見出せると思っています。
小林氏:日本においても、自動車や創薬など強い産業はあり、それらの企業と理研が組んでイノベーションを起こしていくことも十分に考えられます。理研に蓄積されたノウハウが企業に伝播することによって、日本全体がAI for Scienceという枠組みのなかで、サイエンスを推進していくという流れが理想の形といえるでしょうか。
松岡氏:そうですね。グローバルのAI開発に資金面で叶わないとあきらめていては何も始まりません。我々の勝ち筋はなにかというと、今話されたようにさまざまな産業があり、その産業がAIを使っていち早くイノベーションを起こしていくことです。その実現に向けて、理研ではさまざまな産業と共創していきます。
泰地氏:我々の目指すところが基礎研究に近いというのもありますが、我々がこれまで蓄積してきた知識は、企業にとってアクセスしづらい面がありました。それがAIという形で提供できるようになり、これは企業としてはトップレベルの科学者を手元に置けることと同義です。それこそがAI for Scienceの成果だと思います。
松岡氏:基礎研究から実際に社会実装するまでには、非常に長い時間がかかるのが通例でした。ところが今では、AlphaFoldが生まれてわずか数年しか経っていないにも関わらず、すでにノーベル賞を受賞している。これは基礎研究の結果が社会実装されるまでの時間が大幅に短縮されてきたことを意味します。理研に集約された知識やノウハウ、知見、さらに創発性というものが企業に行き渡り、間を置かず社会実装されることで新たなイノベーションが生まれる。そういったムーブメントを起こしていくことが大切です。
泰地氏:我々としても、こうしたムーブメントを幅広い分野に拡大していきたいと思っています。もちろん理研が全部をやるのではなく、日本全体で、エンジニアリングも含めたAI for Scienceの研究開発に向けた環境整備を進めていければと考えています。
***
また、理化学研究所ではブース出展も実施。多くの来場者で賑わっていた。
「科学研究基盤モデル開発プログラム」に関して 詳しくはこちら
理化学研究所計算科学研究センター AI for Scienceプラットフォーム部門 に関して詳しくはこちら
[PR]提供:理化学研究所