スパコン「京」が拓く医薬品開発の未来

京都大学の奥野恭史教授は、スパコンを使って新薬の開発効率を高める研究について発表を行った。

スパコンを使う医薬品開発の研究について発表する京大の奥野教授

細胞増殖たんぱく質にATP(アデノシン3燐酸)が結合すると細胞が増殖する。がんは細胞が異常に増殖する病気であり、この増殖たんぱく質とATPの結合をブロックする化合物があれば、細胞の増殖を抑える抗がん剤となりうる。

黄色のATPが下のたんぱく質の中の細胞増殖を制御する部分に結合すると、細胞が増殖する。ここに別の分子を結合してATPが結合するのをブロックすれば,細胞の増殖を止められる (出典:京コンピュータシンポジウムにおける奥野教授の発表スライド)

がんだけでなく、一般的に、病気の原因となっているたんぱく質を見つけ出し、そのたんぱく質に結合してその機能を制御する新規な化合物を創り出すことで新しい薬が作られる。

しかし、たんぱく質の種類は10万以上あり、化合物の種類は10の60乗と天文学的な数あるので、これらのすべての組み合わせを実験で確かめることは不可能である。スパコンを使って、ある化合物が目的のたんぱく質と結合するか、結合する場合の強さはどの程度かを計算で求めることができれば、実験の手間を省き、新薬の開発コストを下げられる可能性がある。

病気の原因となるたんぱく質は10万種以上あり、また、薬の候補となる化合物は10の60乗と天文学的な数である。スパコンを使って、目的のたんぱく質と強く結合する化合物を効率的に見つけられれば、開発費を低減できる可能性がある (出典:京コンピュータシンポジウムにおける奥野教授の発表スライド)

しかし、現状では、計算機の能力が不足しているので、結合するかどうかを調べることのできる化合物の数が制限される。また、結合の強さの予測も正答率が5%程度と低く、予測精度が悪すぎるという問題があり、問題解決になっていないという。これに対して、奥野教授のグループは、結合パターンの統計ルール化を行い、結合するかどうかの判定の高速化を行う研究を行う。このやり方は、ちょうど、ディジカメがある程度の顔のパターンを学習してルールを作り、画像のなかから人の顔を識別するようなものであるという。

この技術と、京コンピュータの計算能力を組み合わせて、超高速の結合予測を行う。

結合パターンの統計ルール化で、結合するかどうかを高速に判定する。さらに、京コンピュータの計算能力を使って、結合予測のスピードを大幅に引き上げる (出典:京コンピュータシンポジウムにおける奥野教授の発表スライド)

さらに、京コンピュータを使えば、より複雑な計算が可能であるので、結合の強さのシミュレーション精密化して、正答率70%を目指すという。これにより、大量の化合物に対して結合するかどうかのスクリーニングを行い、結合する化合物に対して、高い精度で結合の強さを求めることができるようにするというのがこの研究の目標である。

次の図は、500種の化合物と388種のたんぱく質の相互作用の有無について京コンピュータで予測した結果と、実験での結果を対比したものである。

京コンピュータではこれらの全ての組み合わせについて計算を行って、相互作用ありと判定された組み合わせは赤、相互作用なしの組み合わせは青で表示している。一方、右側の実験では、京コンピュータが相互作用ありと判定した組み合わせを中心に確認をおこなっており、大部分の組み合わせは実験データなしの灰色となっている。

これを化合物3000万種、たんぱく質631種に探索範囲を拡大し、198億3000万の組み合わせをチェックする場合は、16ノードの研究室にあるような普通の計算機でやると2年かかるが、京コンピュータをフルに使用すると5時間45分で計算が終了するという。

化合物500種とたんぱく質388種の相互作用の有無を調べた結果で、左が京コンピュータによる計算、右が実験による結果である (出典:京コンピュータシンポジウムにおける奥野教授の発表スライド)

たんぱく質と薬の結合は水のある状態で起こるので、正答率を70%に高めるためには、結合強度のシミュレーションモデルに水分子を加える必要がある。しかし、多数の水分子を付け加えたシミュレーションは計算時間が非常に長くなり、従来は実用的な時間では計算ができなかった。これが京コンピュータを使うと、水分子を加え、分子の熱運動を考慮して、 15個の化合物とたんぱくの結合の強さのシミュレーションを1週間程度で計算することができるようになるという。