「声」と属性データで高精度なうつ病診断が可能になることを示唆

こころの未来・インスティテュートはこのほど、被験者の性別や年齢などの基本的な属性データのほかに、音声データを使うと、高い精度でうつ病診断が可能になることを発表した。

音声指標と属性データ

同実験は、慶應義塾大学医学部精神神経科学教室、経済産業研究所、統計数理研究所リスク解析戦略研究センター、スマートメディカルと共同で行ったもの。被験者の性別や年齢などの基本的な属性データに加え、声から収集した音声データを加えると、うつ病状態の有無をどれだけ正確に診断できるかを検証した。

被験者は約2,000名。声は、ネットによるオンライン調査で、被験者に2カ月おきの3時点(時点1、時点2、時点3)において音声を吹き込んでもらい音声データを取得した。同時に、うつ病のスクリーニングに使われる質問票にも答えてもらい、うつ病状態の有無に関するデータも取得した。

その結果、音声データを含まない属性だけによる診断精度が中程度だったのに対して、音声データを取り入れた場合では、高精度のうつ病診断が可能となることが確認できた。診断精度の高さは、ROC(AUC)と呼ばれる指標で判断している。

しかし、時点1と時点2からの標本の7割を加工して得られた公式(診断アルゴリズム)を活用し、時点3の音声からうつ病状態の診断を行ったところ、十分な精度は得られなかったとのこと。時点1と時点2といった過去の音声から、未来のうつ病状態の有無の予測も行ったが、期待された結果は得られなかったという。

以上の結果から、音声感情認識技術には、うつ病状態の高精度なスクリーニングにおける高い潜在性が示された。シンプルで効率的かつ、信頼性の高いうつ病診断方法の確立につながる可能性があるという。声による診断方法が実現すれば、診断コストの削減、患者への迅速な対応や的確な治療ができ、臨床的および社会的な恩恵がもたらされることが期待できる、としている。

しかし、一定の時間経過後の対象者におけるうつ病状態の診断、および過去の声から未来のうつ病状態予測については、さらに技術向上が必要であると考えられるとのこと。