富士通研究所は、少数のデータしか学習に使用できない場合でもディープラーニングによる物体検出を可能とするAI技術を開発したことを発表した。

  • 腎生検画像と糸球体検出

    腎生検画像と糸球体検出

近年、さまざまな分野でAIによる作業の自動化への期待が高まっている。同研究所は、京都大学大学院医学研究科と医療分野において共同研究を行っており、取り組みのひとつとして、AIによる腎臓病の診断支援の研究を進めている。

医療分野では、診療画像の分析に異常個所などの物体検出をAIで自動化することなどが望まれている。診療画像から特定の被写体を切り出す物体検出は、ディープラーニングを用いることが一般的だが、精度を出すためには学習させるための数万枚規模の正解データ付き画像が必要となる。しかし、正解データは専門知識を持つ医師が作成する必要があるため大量に準備することが困難であった。

今回、富士通研究所は、少量の正解データ付き画像と、大量の正解データのない画像からディープニューラルネットワークの学習を行うことで、画像の位置特定を可能とする、半教師あり学習による物体検出技術を開発した。

正解データ付き画像を増やすために、大量の画像に対してニューラルネットワークを用いて物体位置を推定させることで正解データを補う方法が考えられるが、従来の技術では、少量の正解データで学習したニューラルネットワークに、実際の物体位置と正確に一致する場所を推定させることが困難で、不正確な推定によるデータが学習に加わることで精度が劣化する。

  • 画像復元により推定位置を検証する新しいネットワーク構造

    画像復元により推定位置を検証する新しいネットワーク構造

そこで今回、検出用ニューラルネットワークの推定結果を手掛かりに、元の画像を復元させる復元用ニューラルネットワークにより、出力された推定位置がどの程度正しいかを検証する技術を開発した。間違った推定位置から復元された画像は、元画像と一致しないため、2つの画像を比較することで推定位置の正しさを検証できる。このように推定と復元を大量の画像に対して繰り返し行い、正解データを増やしながら、徐々に正確な推定位置が出力される状態に近づけることで、精度を上げることが可能となった。

京都大学大学院医学研究科との共同研究において、腎生検画像からの糸球体の検出に同技術を適用し、正解データ付き画像50枚のみを用いて学習した従来の物体検出ニューラルネットワークと、正解データのない画像450枚を活用した同技術を比較した結果、見逃し率10%以下という条件下で、従来の2倍以上である27%の精度を達成した。これは、1画像に平均22個含まれる糸球体に対し、前記の見逃し率で検出するために必要な検討箇所を77個の候補まで絞り込み、後処理のコストが削減されたことになる。こうした精度向上と候補数の削減により、糸球体検出に基づいた腎臓病全体の研究と診断システム開発の加速が期待できる。

この共同研究を通じて、今回行った糸球体検出を応用した、腎臓の定量的な評価手法の実現に向けた研究に取り組む予定だという。同技術は、正解データ付き画像の少ない分野での物体検出に広く応用可能で、製造ラインの画像を使った異物の検出、インフラ設備の各種センサーによる診断画像からの異常個所の発見、建築図面からの使用部材のリストアップなどへ適用先拡大を想定し、AI技術をAPIとして提供する富士通の 「Zinraiプラットフォームサービス」 を支える学習モデル構築技術として、2018年度中の導入を目指すとしている。