産業技術総合研究所(産総研)と日本医療研究開発機構(AMED)は8月29日、2種類の深層学習(ディープラーニング)を組み合わせることで、薬剤とタンパク質の相互作用を予測する手法を開発。大規模データを用いた実証実験により高速かつ高精度に予測および相互作用部位候補を特定することに成功したと発表した。

同成果は、産総研 人工知能研究センター 機械学習研究チームの瀬々潤 研究チーム長、椿真史 産総研特別研究員、産総研 インテリジェントバイオインフォマティクス研究チームの富井健太郎 研究チーム長らによるもの。詳細は学術雑誌「Bioinformatics」に掲載された

年々進化する人工知能技術を医薬分野で活用しようという動きが近年、活発化している。中でも新薬開発については、薬剤となる候補物質の組み合わせが非常に多く、疾患治療に有効な薬剤とタンパク質の組み合わせを高速かつ高精度に予測することは難しかった。

そこで研究グループは今回、薬剤のデータに適した深層学習手法である「グラフニューラルネット」と、タンパク質のデータに適した深層学習手法である「畳み込みニューラルネット」をそれぞれのデータに適用して、薬剤とタンパク質それぞれの性質を適切に捉える「特徴ベクトル」を計算。大規模データとして特徴ベクトルを学習させることで、相互作用の有無の予測に挑んだ。

具体的には、3万5000以上の薬剤とタンパク質の相互作用データを用いた実証評価実験を実施したところ、従来用いられてきたものよりも低次元の特徴ベクトルを用いても相互作用の有無を適切に予測できることが判明。低次元化による高速化に加え、精度も既存のドッキングシミュレーションや近年開発された他の深層学習手法に比べて、3~10%ほどの予測精度向上を確認したとする。

また、計算コストとしても、薬剤のグラフとタンパク質の配列の情報のみで予測が可能であるため安価で実施が可能なほか、立体構造がまだわかっていない膨大な数のタンパク質についても適用可能であることも確認したという。

  • 今回開発された薬剤とタンパク質の相互作用の予測手法

    今回開発された薬剤とタンパク質の相互作用の予測手法 (出所:AMED Webサイト)

さらに、深層学習は予測結果の解釈が難しいことから、相互作用の有無という大まかな予測に加えて、2つの特徴ベクトルを用いて、薬剤が相互作用しやすいタンパク質の部位という、より細かい情報も考慮した予測結果の可視化も実現。これにより、コンピュータによる自動的な予測結果と、人間がこれまでの経験から得た知識との照らし合わせによる結果の妥当性判断が容易にできるようになったとする。

なお、今後について研究グループでは、薬剤やタンパク質の三次元立体構造をより詳細に考慮した手法を開発することで、さまざまな薬剤とタンパク質の相互作用部位の立体構造を網羅的に検証し、予測結果の信頼性を高めていきたいとしている。