前回、今日のAIビジネス応用に求められる、重要な評価指標「目標精度」と、その設定の仕方を中心とした仕事の段取りについて、実態と実質に即して説明しました。目標精度の設定次第で、それに到達するために必要な正解データの量(や質)、そもそも到達可能かどうか(すなわちAI活用業務の実現性可否)、開発コスト、ROI (Return of Investment)が左右されることをおわかりいただけたかと思います。これは、何度強調しても、し足りないポイントです。トップダウンで「何かAIやれ! 」と言われても、決して譲ってはならないポイントだと言えます。

そこで、今回はおさらいを兼ねて、前回紹介した図「AI(特にディープラーニング)応用で極めて重要な精度目標値」にあった例3「がん検出(診断支援)」について解説します。これは、東京大学医学部附属病院とメタデータ社、インスペックが共同で、実質2017年に開始した厚労科研費研究「病理デジタル画像・人工知能技術を用いた、病理画像認識による術中迅速・ダブルチェック・希少がん等病理診断支援ツールの開発」における評価指標「目標精度」の案です。

まず、初年度2016年度の成果報告から、リンパ節に転移したがんの検体画像と、その一部領域が腫瘍か健常かを判定するのに試作した人工知能の判定結果の例です(初出:セミナー「人工知能ソフトウェア活用の勘所」, 講師:野村直之, 文京区民センター, 2017.2.20)。

リンパ節に転移したがんの検体画像と、その一部領域が腫瘍か健常かを判定するのに試作した人工知能の判定結果の例

上側に、「健常」「腫瘍」と記した検体画像は、ギガ・ピクセル級です。実際には9億画素~36億画素という超高精細の病理診断用画像となります。これは、JPEGなどのファイルフォーマットの規格外の特殊形式であり、1枚あたり、0.5~1.6GBものファイルサイズとなります。

共同研究で培ったノウハウにより、下側の3枚の画像のように細部を切り出して、CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)と呼ばれるディープラーニングに「健常」部か「腫瘍」部かを識別させ、確率値を算出しています。特徴を自動で残しつつ大胆に縮小、情報を省略していくのがCNNの真骨頂です。256×256ピクセル程度の小さな画像に(1つ)写っているモノの名前を当てるのが本来の役割ですから、ギガ・ピクセル画像を扱う場合は、さまざまな工夫を施す必要があります。

2016年度に数週間実施したプロジェクトでは、まず、画像全体を、数千枚~数万枚の256×256ピクセルの小さな画像に分割。これらの各領域が腫瘍かどうか判定させ、全体にその分布がどうなっているかをわかりやすく表示するソフトウェアを開発しました。

目標精度の設定

この課題の目標精度は、プロジェクト開始時点で、下記のように仮決めしてみました。

●手術中に候補を出す場合
・確率値で第1位の症状名称の適合率P > 0.50
・確率値で第1位~第5位の合計値(再現率R) > 0.95
●病理センターで1週間ほど検体を預かってじっくり診断する場合
・確率値で第1位~第50位の合計値(再現率R) > 0.995

手術中に、500種類の可能性や違う種類のがんの候補をAIに出力されても、それを医師が深く吟味している余裕などないでしょう。ベスト5に自分の見立てと同じ種類の癌が入っていたとして、AIが「より確率が高い」と判断した他の数種類と比較吟味しながら、開腹中の処置を決めることができれば、十分な医療の進歩と言えるのではないでしょうか。

一方、病理検査の専門部署が1週間ほど検体を預かって、超高解像度画像を精査するアプローチでは、100近い種類の癌の可能性を精査することができます。ですから、そのAI流の判定根拠(となった画像)を提示しつつ、より一層精密な診断を助けるためには、多くの可能性を指摘することが真骨頂のコンピュータ(AIという道具も含む)に期待すべし、ということで、可能性の上位50位までに99.5%存在することは確保したい、と考えた次第です。

前回説明したように、ディープラーニングをはじめとするend-to-end computing(生データコンピューティング)では、実は、精度評価は非常に容易です。正解データセットを自動分割して、トレーニングに不使用のデータを使って自動で精度を求められます。ですので、AI応用のビジネス企画で、目標精度の設定を避けるのは愚の骨頂であり、投資する立場の自殺行為とさえ言うことができます。

ビジネスでなく、AI自体が研究対象でもなく、その何十倍、何百倍もの多くの領域、テーマに及ぶ「AIを(道具、装置として)応用した研究」でも、上述の癌の病理診断と同様、目標精度の設定は必須です。目標精度こそが、研究の目的・意義の根幹に位置します。

最後に、ディープラーニングについて、ビジネス上の含みを込めて、頭に入れておくべきことを以下にまとめます。

  1. 人がプログラミングせず入出力の正解データを大量に投入して「学習」
    1. 特徴を全自動で抽出し、未知データを認識・分類・生成
    2. 1,000の一般画像認識で97.4%と、ヒトの精度超え (2015.12)
    3. 人間のように学習しているわけではないが優秀な道具になり得る
  2. 結線上の重みが逆誤差伝播などで自動で学習され、精度保障が困難
    1. 生データコンピューティング(end-to-end computing)
    2. 入出力の対応関係を大量に投入して徐々に高精度化
    3. 数式やIf-Then-Elseの従来型プログラムとは根本的に違う
    4. 論理、言葉で説明不能な特徴や条件、法則性を勝手に習得
  3. 精度がデータの量や質に大きく依存
    1. 本番さながらの実験を行ってみるまでは、実用性が不明
    2. 成功・失敗、改善・改悪の原因分析が困難で追加投資、保守予算が見えにくい
    3. ベンダーとユーザー間の責任分界点が不明確になりやすい
      1. 機密データをITベンダーに開示できない企業は買い手でありながら、精度の責任を負う

3.3.1のような問題点を解決すべく、メタデータは、産業界で足を地につけたAI普及の一翼を担うため、責任を持って「学習済ディープラーニング」を販売する事業の看板を掲げています。

著者紹介

野村直之


野村直之 - メタデータ株式会社 代表取締役社長 理学博士

NEC中央研究所、MIT(マサチューセッツ工科大学)人工知能研究所、ジャストシステム、リコーなどを経て05年にメタデータを創業。人間がより人間らしい仕事に集中できるよう、深層学習などのAIを含む高度なアルゴリズム、データ分析ツールでホワイトカラーを支援する使命を果たすべく日々奮闘中。