米SAS Institute(以下、SAS)は4月28日から5月1日にかけて、年次プライベートイベント「SAS Global Forum 2019」を開催した。同イベントでは金融、ヘルス/ライフサイエンス、製造業、小売といった各産業のユーザー企業が登壇し、分析に関する自社の取り組みを披露した。

日本からは、大手製薬会社である塩野義製薬(以下、塩野義)が登壇し、「畳み込みニューラルネットワーク(Convolutional Neural Network)」を活用した、の解析システム開発の取り組みについて発表した。

塩野義は医薬品業界の中でも積極的にデジタルトランスフォーメーションに取り組んでいる企業だ。2017年にはビッグデータ分析・解析を行う専任組織「デジタルインテリジェンス部」を設置し、創薬などへのデータ活用を推進している。

今回登壇した木口亮氏が所属する医療開発本部解析センターは、開発品の臨床試験にかんする計画立案をはじめ、集積したデータ管理、データ解析に用いる統計解析手法の検討/実施などを行っている部署だ。また、新技術やデータをどのように医薬品開発に活用するかについても検討しているという。

  • 塩野義製薬医療開発本部解析センターData Scienceグループ 木口亮氏

今回の講演で取り上げた「畳み込みニューラルネットワーク(以下、CNN)」とは、ディープラーニングの一種だ。何段もの層を持つ、脳機能に見られる特性に類似した数理モデルで、画像や動画の認識に広く使用されている。

その画像認識技術で「図表計画書」というドキュメントの解析にチャレンジした。きっかけは、「人間が図表を読む時、文字だけではなく図表を“画像”としても捉えているのでは?」と考えたからだ。つまり、図表計画書をスクリーンショットで撮影し、それを画像データに置き換えCNNに見た目(内容)を判定するという取り組みだ。

  • 図表は文字と線の集合体だが1枚の画像でもある。図表計画書のスクリーンショットを取って「jpgファイル」に変換すれば「画像データ」になる。つまり、すべてのデータは画像データとして捉えられるのだ

木口氏は「例えば、図表計画書の特定部分に文字がたくさん書かれていれば、人間はそれが意味すること(有害事象であるかなど)を瞬時に判断しているのではないかと仮説を立てました。そこで、クラウド対応の人工知能(AI)プラットフォームである『SAS Viya(以下、Viya)』でCNNのプログラムを作成し、CNNで解析図表を『画像』として捉えるようにしたのです」と説明する。

それまで図表計画書の解析はデータマイニングやテキスト解析などを中心に実行していた。ただし、データマイニングなどは1つの手順でしか解析できない。複数の手順で解析したほうがよいとの観点からさまざまな手法を探していたところ、CNNにたどり着いた。

ただし、この取り組みはCNNの活用で作業効率化を目指すことに主眼を置いたものではないという。「こんなアイデアでもCNNは活用できるという可能性の“幅”を示したかったのです」と木口氏は語る。

CNNの弱点は「解析結果の解釈が難しいこと」だという。しかし、ViyaのCNNでは、決定基準の情報と解析結果(ヒートマップ)を可視化できる。つまり、機械が画像のどこを見て分類したのかがヒートマップでわかるため、解析結果を解釈できるのだ。なお、システムの一部にCNNプログラムを組み込んだところ、性能が上がり、図表計画書の解析タスクの33%まで削減できたとのことだ。

  • モデルと解析結果(ヒートマップ)。機械が画像のどこに“着眼”して分類したのかを確認できる