東京大学(東大)は4月6日、人工衛星に搭載された「マイクロ波放射計」の観測値を利用して地上の降水量を推定する、新たな機械学習手法を提案し、既存手法と比べて12.6%の精度向上を達成したことを発表した。

同成果は、東大 生産技術研究所(東大 生研)の金炯俊特任准教授と、東大大学院 工学系研究科の坂内匠大学院生、京都先端科学大学 工学部の内海信幸特任准教授らの共同研究チームによるもの。詳細は、地球科学全般を扱う学術誌「Geophysical Research Letters」に掲載された。

降水量の正確な把握は、地球の水循環の理解を深めることに加え、今後ますます貴重になる水資源、さらには災害時対応のためにも非常に重要だ。全球レベルで降水量を測定するには、衛星観測が唯一の手段となる。そうした中で重要な役割を担っているのが、2014年に米国航空宇宙局(NASA)と宇宙航空研究開発機構(JAXA)が主導して開始した「全球降水観測計画」(GPM)だ。

GPMの降水量推定に向けたアルゴリズムには、さまざまな手法が提案されてきた。2010年代半ばからAI技術が進展したことから、近年は機械学習を用いた手法も数多く提案されている。しかし、これらの既存手法はデータ駆動型モデルであり、衛星観測から降水量を推定するタスクに関する知識は考慮されていないという。そこで研究チームは今回、衛星降水量推定に関する理解をモデルに明示的に組み込むことで、モデル内で相互依存的な知識の交換を実現し、降水量推定精度を向上させる手法を提案したとする。

今回の研究では、GPMに搭載されているマイクロ波放射計から、地上降水量を推定するための機械学習手法が提案された。研究チームは、畳み込みニューラルネットワーク(CNN)と全結合ネットワークを用いて、降水量を出力するというモデルを設計。同モデルに対し、マルチタスク学習という深層学習の手法を用いることで、降水強度の分類モデルと降水強度の推定モデルを統合し、同時学習するモデルが提案された。

マルチタスク学習は、画像処理や自然言語処理の領域ではその有効性が確認されている手法。今回の研究ではそれが衛星降水量推定に応用された。応用にあたって、気象分野で用いられるしきい値から降水の強さを「降水なし」「弱い雨」「中程度の雨」「強い雨」と定義して、それらを分類するモデルが降水量推定の関連タスクとして定義された。

また機械学習の誤差を考慮した評価を行うために、今回の研究ではモデルを多数回、独立学習させ、その平均と分散を考慮して結果評価するアンサンブル実験が採用された。

そして実験の結果、提案モデルは従来の深層学習モデルより、降水量推定では12.6%(MAE)、降雨有無分類では37.4%(CSI)の改善率が達成されたという。また、既存の降水量推定データとの比較においても、提案モデルは全般的により良い精度を実現していると同時に、バイアスの少ない降水量推定を実現できていることが確認されたとする。

  • (左)マルチタスク学習を用いた衛星降水量推定。(右)アンサンブル実験(Single-taskとTwo-taskの比較)。降水量推定の精度を二乗平均平方根誤差(RMSE)、平均絶対値誤差(MAE)、相関係数(CC)の3指標で評価。全データ(All)に加えて、降水量強度別(Weak:0.1-1.0mm/h、Moderate:1.0-10.0mm/h、Heavy:>10mm/h)で評価を実施。多数回の実験結果のヒストグラムが示されており、降水強度ごとの改善度合いがばらつきも含めて表現されている

    (左)マルチタスク学習を用いた衛星降水量推定。(右)アンサンブル実験(Single-taskとTwo-taskの比較)。降水量推定の精度を二乗平均平方根誤差(RMSE)、平均絶対値誤差(MAE)、相関係数(CC)の3指標で評価。全データ(All)に加えて、降水量強度別(Weak:0.1-1.0mm/h、Moderate:1.0-10.0mm/h、Heavy:>10mm/h)で評価を実施。多数回の実験結果のヒストグラムが示されており、降水強度ごとの改善度合いがばらつきも含めて表現されている(出所:東大 生研Webサイト)

研究チームは、降水量推定と降水有無分類を同時学習することで精度向上につながった理由として、衛星のマイクロ波放射計に対する両タスクの背後にある物理的なメカニズムが一貫しており、同時学習によりモデル内で知識共有が働いたことが要因と考えられるとする。このことから、雨や雪、霙(みぞれ)などといった降水種類の分類や、降水をもたらす雲種類の分類も物理的に関連している現象のため、これらを同時学習することでも精度向上につながる可能性があると考えているとする。

今回の研究では、降水強度と降水分類の物理的な整合性に着目したモデル提案が行われたが、今回の手法はさまざまな物理的な降水過程をモデル内で表現することへの拡張が可能だという。また今後、気象学や雲微物理学との融合による、さらなるモデル精度の向上が期待できるとした。

そして物理的な理解と機械学習の融合はデータ駆動型モデルの課題(大量の訓練データが必要・物理的な整合性が担保されない・ブラックボックスモデル)の解消につながるとする。その点で、今回の研究は今後の機械学習を用いた衛星降水量推定における新たな可能性が示されていると考えられるとしている。