東北大学は6月14日、運動周波数に着目することで、事前の身体力学モデルの想定なしに、力学条件に応じて運動モードを適応的に調整できるニューラルネットワーク(NN)を構築することに成功したと発表した。
同成果は、東北大大学院 工学研究科の林部充宏教授、同・グアンダ・リ大学院生、ケリー・シェン大学院生(研究当時)らの研究チームによるもの。詳細は、英オンライン総合学術誌「Scientific Reports」に掲載された。
ヒトは、たとえば直立の姿勢から前へならえのように両腕を素早く前に出す際に、同時に体幹を腕と反対の後ろ側にそらす動作を無意識的に行う。これは、ヒトの中枢神経系が身体の力学的運動に関する内部予測モデルを構築していることを示すもので、身体部位の加速や減速に伴う、慣性力の予測とそれを相殺する運動を認識していることを意味するものだという。
環境適応的な姿勢制御を行うための神経回路網を構築するためには、その学習過程が重要だ。特に、成長・加齢によって身体特性が変化する場合や、乳幼児期の身体の力学情報が未知である場合に、生体の学習機能によって姿勢の安定と維持のための運動制御の適応性を向上させることが必要となる。その適応プロセスを再現することは、ヒトの運動制御に関する自己組織化の背景にある仕組みを理解することにもつながるという。そこで研究チームは今回、身体に関する力学方程式を事前知識として想定せずに、運動モードを適応的に調整できる自己組織化NNの構築を試みたとする。
ヒトの姿勢制御は主に足首関節と股関節の協調運動により行われており、身体の揺動が小さくバランスの余裕がある時には、足首関節と股関節は同じ方向に同相で制御され、身体の揺動が大きくバランスの余裕がなくなる時には逆相で制御されている。この自己組織的プロセスは、先行研究では人体力学モデルに基づいた数学的最適化計算でそれを再現するものが報告されている。
それに対して今回の研究では、事前知識を用いずに、運動経験と深層強化学習により自己組織化現象をNNによって再現できるかどうかの検証を行ったという。学習後のNNは、運動周波数の増加に伴い同相制御から逆相制御に遷移していく振る舞いを示し、ヒトと同様の運動モード遷移プロセスを再現することができたとする。また、モード遷移に関与する要因として、運動周波数、エネルギー効率が大きく関与していることがわかったとのことだ。
省エネルギーの観点からは、足首関節と股関節の同相協調は、バランスを実現する解が存在すれば、逆相の協調よりも基本的にエネルギー消費が少なく済む。しかし、身体の質量慣性の影響を受け、身体の重心変化を積極的に少なくする必要性が生じると、股関節の運動をそれまでとは異なる方針で用いる逆相モードに移行することが判明したという。さらに、股関節の硬さ、上肢の重さなどの身体パラメータも、モード切替えのタイミングに影響を与えることが確認されたとする。
また学習したNNは、学習条件の範囲から外れた状況でも適応性を示したとする。学習時には、運動周波数を離散的に設定した一定の周波数で行っていたため、たとえNNが連続的な周波数変化の下で訓練されていなくても、時間的に変化する目標周波数の変化に適応し、同相から逆相への一貫したモード切替えを連続的に出力することができたとしている。
さらに学習後のNNは、未経験である上半身の慣性を増加させた場合、より早いタイミングで運動モードを自己組織的に逆相に変化する振る舞いが示されたとする。これは、上半身の慣性力増加によりバランスが不安定な状況になるタイミングが早く訪れたことに適応し、エネルギー的に効率的な同相モードから、バランスを優先する逆相モードに変更することで運動タスクを達成する自己組織的な振る舞いが示されたと結論付けている。
生体の自己組織的な振る舞いの生成をAIにより実装することは、生体の身体に潜む冗長性問題があるため、困難が予想されるとする。AIは、基本的に1つもしくは少数の正解を生成する場合には向いているが、同じ種類の運動タスクの実現においては、必ずしも1つの正解パターンがあるわけではなく、無数の解が存在する場合があるからだ。そのため、どの制御モードが適しているのかを運動タスクや環境の力学条件に適応し、自己組織的にまた連続的に生成させるのは容易ではないとする。今回の研究では単純な運動タスクが扱われたが、強化学習により自己組織的に振る舞うNN生成の可能性が示されたことは、この問題の解決に向けての一歩となることが期待されるとのことだ。
また今回の関連研究で、深層強化学習により、ヒトの計測データを使わずに自然なリーチング運動パターンを生成できることを示しており、今回の学習フレームワークとも共通性があるため、生物的な振る舞いを示すAIの開発につながる知見となるとしている。