広島大学、京都大学(京大)、生命創成探究センター(ExCELLS)の3者は5月26日、主観的なものであるため第三者が客観的に数値化することは不可能と考えられてきた「報酬をとるか、好奇心に従うか」といった心の揺れや葛藤について、行動データから心理状態の時間変化を読み解く手法「逆自由エネルギー原理法」などを開発し、動物の行動データから報酬と好奇心との葛藤を解読することに成功したと共同で発表した。

  • スロットマシン課題の行動データから逆自由エネルギー原理法によって「心の揺れ・葛藤」を解読する。

    スロットマシン課題の行動データから逆自由エネルギー原理法によって「心の揺れ・葛藤」を解読する。(出所:共同プレスリリースPDF)

同成果は、広島大大学院 統合生命科学研究科 データ駆動生物学研究室の本田直樹教授(京大 生命科学研究科 特命教授/ExCELLS 客員教授兼任)、同・大学院 統合生命科学研究科の古仲裕貴大学院生らの研究チームによるもの。詳細は、計算技術と数学モデルに関する全般を扱う学術誌「Nature Computational Science」に掲載された。

ヒトの感情や心の葛藤はどのように生まれ、制御されているのかという問いに答えるには、心理状態の時間変化と脳活動を比較する必要がある。しかし、心理状態の定量化は困難であるため、自然科学全般の基礎となっている「計測データに基づく仮説検証」はほとんどなされていなかったという。

慣れ親しんだ確実な報酬か、それとも外れの可能性もある好奇心を満たすかの二択など、葛藤を例にしてみる。たとえば、「お気に入りのレストランに行く」か「新しいレストランを試す」か、と悩むのは、報酬と好奇心との正しい葛藤だといえる。

研究チームは、このような葛藤がアンバランスになると、意思決定が非合理的となるとする。つまり、好奇心がゼロだと、既知の報酬に固執するあまり未知のより高い報酬を見逃してしまう可能性がある。逆に好奇心が過度に強いと、外れを引き当てる確率も高く、既知の報酬を逃してしまう危険性がある。したがって、こういった心の葛藤を理解するためには、非合理的な意思決定を記述する新しい理論が必要だったのである。

これまでの意思決定理論において提唱されてきた「強化学習」や「自由エネルギー原理」などは、報酬や情報を最大化するという合理性・最適性に基づいているため、報酬と好奇心との葛藤が時間と共に変化すると考えられる実際の動物行動を扱うことができなかったとする。そこで今回の研究では、報酬と好奇心との葛藤が生じる行動として、ラットを用いたスロットマシン課題に注目することにしたという。

同課題は、ラットが2つのスロットマシンのうちの1つを選び、その結果として確率的に報酬が得られるというものだ。ラットはどちらの報酬確率も知らず、また報酬確率自体も時間的に変化する仕組みだ。

同課題において、片方のみを選択し続けると、その報酬確率を正しく認識できるようになる。しかし、もう片方は選ばれていないため、その報酬確率の認識はより曖昧になっていく。そのため、あまり選ばれなかった方に対する好奇心が湧き、報酬確率を知りたくなることが予想される。つまり同課題を用いることで、「報酬に対する欲求」と「環境(報酬確率)を知りたいという好奇心」との葛藤を伴う行動データを取得することができるのである。