AI(Artificial Intelligence:人工知能)を搭載した家電やスマートフォンなど、AIを使う場面は私たちの生活にもだいぶ浸透してきたように感じる。出不精の筆者などは、1日のうちに話す相手が寝室に鎮座するスマートスピーカーだけという日も珍しくない。
ところが、AI開発となると話は別だ。AIは専門のエンジニアが技術を注いだ末にようやく開発できるものであり、プログラミングや統計解析など目を覆ってしまいたくなる量の学習を積み重ねなければAI開発には到底着手できないはずだと思っている。
ことさら「医療用AI」と聞くとさらに遠い世界のように感じてしまう。きっと医学と工学の専門家が侃々諤々(かんかんがくがく)の議論の末に作り出しているのだろう。その一方で、国内でも医療費の増加や医師数の地域間格差が進んでおり、医師の働き方改革なども伴って、AIを活用した効率的な研究や診療の補助は急務となっている。
このような課題に対して、「AI開発支援プラットフォーム」によって医師によるAI開発を支援するのが、富士フイルムだ。同プラットフォームを利用すれば、プログラミングなどの工学的な専門知識がなくても、医師や研究者が自分自身で画像診断をサポートするAIを開発できる。
医療画像用AI開発プラットフォームを学ぶ講座に参加
富士フイルムと順天堂大学は、画像解析技術や自然言語処理技術に基づく医療AIの社会実装を目指して、社会連携講座を開講している。この講座では、富士フイルムが社会実装を進める臨床アプリケーションや医療画像用のAI開発プラットフォームなどを実際に体験しながら、ヘルスケア事業を取り巻く先端的技術や課題などを学べる。
この度、同講座で大学院生が実際に医療画像用のAI開発プラットフォーム「SYNAPSE Creative Space」の使い方を学ぶ講義を見学した。講義には、医師や社会人として活躍しながら大学院生としても学んでいる学生が参加していた。
富士フイルムが2018年に発表した「REiLI」は、医療用画像情報システム「PACS(Picture Archiving and Communication System)」に蓄積された多量の画像データと、同社独自の医療用画像処理技術を組み合わせたAI技術ブランドだ。同社が強みとする画像処理技術を投入している。
このブランドのもとで、富士フイルムはMRIノイズ除去技術や肋骨骨折判別技術、手術用ガーゼ認識機能など数々の医療AIを展開している。今回の講義で実習に用いられたSYNAPSE Creative Spaceもその一つ。AI技術により病変の検出やレポーティング作業を支援し、画像診断に要するワークフロー全体の効率化を支える。
医師によるAI開発を民主化するために
一般的に、AIによる医療画像の診断支援技術を確立する際には、多量のデータに専門医が正解のラベルを付与して教師データを作る「アノテーション」という作業が必要だ。AIはアノテーションされた多量データに基づいて学習することで、未知のデータに対しても高い精度で適切な回答を提示できるようになる。
ところが、アノテーションは往々にして手作業で行われるため、膨大な時間を要する。加えて、学習データの作成から学習モデルの設計、学習の実行、モデルの評価まで、開発の各工程には工学的な専門知識が必要であり、多忙な診察や研究の合間を縫って医師がAIを開発するのは困難だ。
そこで、富士フイルムは「工学的な知識が少ない医師でもAIを開発できるプラットフォーム」として、自社開発環境を外部に提供を開始した。患者数の多い主要な疾患というよりも、むしろ難病や希少がんなどの患者数が少ない疾患に関してAI開発の機会を増やし、社会実装を進めるのが目的とのことだ。
主要疾患は各製薬会社が注力して研究を進める一方で、希少疾患は数が多いものの個々の疾患に着目すると患者数も研究者も少ないため、すべての疾患に対して網羅的に1社がAI開発を進めるのは難しい。こうした領域の疾患に関するAIの開発を医師にアウトソーシングし、実用化のめどが立てば収益に応じたライセンス費用を支払う仕組みだ。
医療機関としては医師の研究の加速が見込める上、研究からAIの社会実装までの道筋が明確化することでビジネスとしての収益化も狙える。医師はAI開発を行うためのソフト面およびハード面での環境構築や、学習モデルの設計に必要な知識の習得が不要となり、これまでデータ管理などに費やしていた時間も削減できる。
SYNAPSE Creative Spaceで作業してみよう
SYNAPSE Creative Spaceは、データの匿名化からアノテーション、学習モデルの設定、学習プロセス、AIの実行まで、一連の作業を支援するシステムだ。クラウド上に開発環境を作成するため、新たに機材などを購入することなく既存のPCでも利用可能。PCにはクラウドへのリモートデスクトップ接続ツールをインストールする。
SYNAPSE Creative Spaceでは、画像から臓器の抽出や腫瘍など異常領域を検出する「Segmentation」、検出対象をバウンディングボックス(矩形の枠線)で特定する「Detection」、画像所見に対する良悪性の鑑別や遺伝子タイプの推定などを行う「Classification」など、複数の学習エンジンを搭載している。
今回の講義では、低線量CT画像から肺結節を検出するDetectionのAIモデルを作成する際のアノテーションを体験した。肺結節はX戦画像やCT画像に白っぽい影として写り、肺がんなどの疾患の可能性が示唆される。肺がんは男女ともに高い死亡率が示されており、CT画像などからの早期発見が重要となる。
アノテーションでは、肺のCT画像画像の中から肺結節が見られる領域をドラッグ&ドロップのマウス操作でバウンディングボックスで囲むだけで完了する。複数のスライドに対して同様の作業を施すことで、三次元的な検出も可能となる。
アノテーション後の保存は「一次保存」と「二次保存」の2段階がある。これによって、あまり作業に慣れていない医師がアノテーションした場合でも、経験豊富な専門医が最終的な確認を行える。アノテーション後は学習だ。学習エンジンにはNVIDIAのGPUをクラウド上で使用する。
学習済みのモデルを用いて新規の画像に対する推定が行えるのだが、この推定結果をアノテーション用のデータとして利用することもできる。つまり、ある程度の精度で一度多量の画像をAI推定してから、細部の調整だけを人の手で行うことで作業の効率化とAIの精度向上が狙えるのだ。
Detection精度の評価には、再現率(Recall)を指標として用いた。再現率は真に正解のデータのうちAIが正解だと予測した割合を示す。偽陽性の発生をある程度許容するが取りこぼしを減らしたいような場面で使われるため、がん診断や異常検知などに適している。
講師を務めた富士フイルムの越島康介氏は、講義の最後に「AIを利用できる医師を医療現場に増やしていきたいと思っています。先端技術を研究する先生だけでなく、より多くの現場の医師に当社のAIやプラットフォームを使っていただくことで、地方や海外の医師でもKOL(Key Opinion Leader)のようなレベルに到達できる状況になれば嬉しいですね」とコメント。
さらに「本年度はトライアル的な実施となりましたが、来年以降は大学院生だけでなく学部生にも講義の窓口を広げる予定です。データサイエンスの知識を持った医療者が少しでも増えれば、これまで活用されてこなかった医療データも有効に利用できるようになるのではないかと期待しています」とも述べていた。