大阪公立大学(大阪公大)は11月20日、重力波信号から連星ブラックホールの2つの物理量(パラメータ)の「チャープ質量」と「有効スピン」を推定するモデルをそれぞれ構築すると共に、機械学習モデルが予測時にどの情報に注目したのかを可視化する「アテンションマップ」による注目領域の比較を実施し、さらに観測データに含まれる「突発的雑音」(グリッチ)への影響も評価した結果、影響が大きい場合に注目度が高まる傾向を確認したと発表した。

加えて、このモデルは理論的に重要な信号領域に注目することで、物理的に意味のあるパラメータに基づく推定の可能性が示されると同時に、アテンションマップにより、推定結果の信頼性を判断できることが判明したことも併せて発表された。

  • 重力波パラメータ推定に関する概念図

    機械学習モデルを用いた重力波パラメータ推定に関する概念図(出所:大阪公大Webサイト)

同成果は、大阪公大大学院 理学研究科の岩永響生大学院生(研究当時)、同・伊藤洋介准教授らの研究チームによるもの。詳細は、米国物理学会が刊行する素粒子物理学や場の理論・重力などを扱う学術誌「Physical Review D」に掲載された。

ブラックホールの謎に挑むAIの信頼性向上へ

時空の歪みが光速で伝わる重力波の信号を解析することで、ブラックホールの質量や自転といったパラメータを推定することが可能だ。しかしこれまでのパラメータ推定手法は、膨大な計算コストを必要とすることが課題とされてきた。そこで近年では、機械学習を用い、重力波源のパラメータ推定にかかる計算コストを削減する研究が進められている。実際に先行研究では機械学習により、従来手法と同等の精度を保持しつつ、高速にパラメータ推定を行える可能性が示されていた。

しかし重力波源のパラメータ推定においては、機械学習が持つ「ブラックボックス」問題への考慮が不可欠。機械学習は大量のデータから特徴を学習し、自律的に出力を生成するため、その判断根拠が不透明になりやすいため、現実的な応用を考える場合、機械学習モデルの結果の信頼性を向上させることが重要となる。

そこで研究チームは今回、機械学習モデルが予測時にデータのどこに注目したのかを示すアテンションマップを導入。その上で、重力波信号から連星ブラックホールのチャープ質量と有効スピンというパラメータを推定するモデルを独立に構築し、それぞれのモデルが注目した領域の違いを調べたという。

連星ブラックホールでは、2つのブラックホールが共通重心の周囲を公転する際に重力波を放出することで運動エネルギーを失い、徐々に接近していく。軌道半径が小さくなると軌道周期が短くなるが、その短くなり方を特徴づける主なパラメータがチャープ質量であり、これは2つのブラックホールから求めることが可能だ。

一方、2つのブラックホールの自転角運動量の、連星軌道面に垂直な方向の成分を考え、その2つの量について、ブラックホールの質量に応じた重みをつけた平均が有効スピンである。これは天体の質量に次いで、重力波の時間発展を特徴づける主要パラメータとなる。

調査の結果、両機械学習モデルは、両パラメータの効果が顕著に現れる領域に注目していることが確認された。重力波信号において、連星ブラックホールのチャープ質量と有効スピンがその特徴を示すデータ上の領域は、理論的に解明済みだ。例えばチャープ質量は、重力波信号の初期、両ブラックホールが互いの周囲を公転している際に。その影響を最も強く示す。この理論的な予測と、機械学習モデルが注目した領域を比較した結果、機械学習モデルが物理的に意味のある情報に基づいてパラメータ推定を行っている可能性が示された。

さらに、今回はアテンションマップを応用し、重力波の観測データに現れるグリッチの影響も評価された。その結果、グリッチのパラメータ推定への影響が大きいほど、グリッチへの注目度合いが大きくなる傾向が確認された。つまり、アテンションマップを用いることで、機械学習モデルによるパラメータ推定の結果が信頼できる場合とそうでない場合とを区別できるとした。

  • 機械学習モデルへの入力データとそれぞれ自転角運動量に関するパラメータ

    (a)機械学習モデルへの入力データ。重力波信号の周波数の時間変化を示す。(b・c)それぞれ自転角運動量に関するパラメータと、質量に関するパラメータを推定するモデルのアテンションマップ(出所:大阪公大プレスリリースPDF)

機械学習の応用に関する先行研究では、既存手法より計算効率が高いことや、特定の作業を自動化するなど、その利便性を主張するものが多かった。一方で今回の成果は、機械学習やそれをベースとしたAIを実用的に導入する上で、利便性のみならず「信頼性」の観点も重要であると指摘できたとする。また、機械学習も一定の信頼性を持つ可能性が示された形だ。

現時点で、今回の結果は機械学習モデルの注視領域と各パラメータの効果が現れる領域が、おおよそ一致していることを示すに留まる。しかし今後は「マルコフ連鎖モンテカルロ法」や「フィッシャー解析」などを用いることで、これらがどの程度一致しているのかを定量的に示せる可能性があるとした。さらに、グリッチの影響を取り除いた後のデータに対するアテンションマップの適用も興味深い研究対象としている。