医工連携で世界1位に

2017年3月、皮膚疾患の自動判別に関する国際コンテスト「ISBIチャレンジ2017」で、カシオ計算機と信州大学のチームが部門1位を受賞した。皮膚を撮影した画像から、人工知能(AI)が疾患名を正確に診断する、未来の医療支援のための研究でトップに輝いたのだ。コンテストの概要は別記事『カシオ、画像解析の応用技術で国際コンテスト「ISBIチャレンジ」の1位に』を参照していただくとして、本記事ではチーム代表(4名)の取材を通して、勝利の背景を探りたい。

左から、カシオ計算機 研究開発センター 浜田玲氏、松永和久氏、信州大学医学部皮膚科学教室の皆川茜助教、古賀弘志講師

コンテストのルールがやや込み入っているので、先にまとめておく。

競技は、主催側が用意した試験データ(Final Test Data)の皮膚の症例画像600枚を、人工知能で自動解析して分類、その正確さを競うというものだ。エントリーはWebサイトを通じて行われ、参加者は解析の結果をWebサイトから提出。成績もWeb上で発表される。

症例画像には、以下の3種類が混在している。

  • メラノーマ/悪性黒色腫(がん)
  • ほくろ(良性腫瘍)
  • 脂漏性角化症(良性腫瘍)

各画像に対して、2種類の判定を実施。

  • メラノーマ判定(メラノーマか、そうでないか)
  • 脂漏性角化症判定(脂漏性角化症か、そうでないか)

評価は、メラノーマ判定のスコア、脂漏性角化症判定のスコア、平均値のトータルスコアという3つに対して下される。カシオと信州大学のチームが1位を獲得したのは、このうちのトータルスコアだ。

カシオと信州大学のジョイントチームがランキング1位と表示されている。ISIC 2017のWebサイトで見られる

主催側は、試験データの600枚とは別に、AIを鍛えるために以下のデータを提供している(合計2,000枚、すべて性別と年齢の情報を付与)。また、参加者は各自で症例画像を用意して、機械学習に利用しても構わないことになっている(要申告)。

  • 人工知能をディープラーニングで学習させるためのデータ(Training Data)として、正解の疾患名付きの症例画像を2,000枚。
  • 途中経過確認用のバリデーションデータ(Validation Data)として、正解の疾患名が付かない症例画像を150枚。

主催側では、学習用データを2016年12月9日に公開し、バリデーションデータと試験データを年明けの2017年1月7日に公開した。ただし、後述するが、試験データは途中で変更されている。

途中経過確認用のバリデーションデータは、判定結果をアップロードするとトータルのスコアが参加者全員に分かるようになっており、判定とアップロードは何度でも行える。つまり、参加者は自分たちのAIがどの程度ブラッシュアップできているか相対評価でき、納得がいくまでAIを鍛えられる仕組みだ。

コンテストには世界中から22チームが参加。各国の大学や法人、医療機関、あるいはそれらの混成チームなどが多く、人工知能の研究を専門とする大手企業なども名を連ねていた。