医工連携で世界1位に
2017年3月、皮膚疾患の自動判別に関する国際コンテスト「ISBIチャレンジ2017」で、カシオ計算機と信州大学のチームが部門1位を受賞した。皮膚を撮影した画像から、人工知能(AI)が疾患名を正確に診断する、未来の医療支援のための研究でトップに輝いたのだ。コンテストの概要は別記事『カシオ、画像解析の応用技術で国際コンテスト「ISBIチャレンジ」の1位に』を参照していただくとして、本記事ではチーム代表(4名)の取材を通して、勝利の背景を探りたい。
コンテストのルールがやや込み入っているので、先にまとめておく。
競技は、主催側が用意した試験データ(Final Test Data)の皮膚の症例画像600枚を、人工知能で自動解析して分類、その正確さを競うというものだ。エントリーはWebサイトを通じて行われ、参加者は解析の結果をWebサイトから提出。成績もWeb上で発表される。
症例画像には、以下の3種類が混在している。
- メラノーマ/悪性黒色腫(がん)
- ほくろ(良性腫瘍)
- 脂漏性角化症(良性腫瘍)
各画像に対して、2種類の判定を実施。
- メラノーマ判定(メラノーマか、そうでないか)
- 脂漏性角化症判定(脂漏性角化症か、そうでないか)
評価は、メラノーマ判定のスコア、脂漏性角化症判定のスコア、平均値のトータルスコアという3つに対して下される。カシオと信州大学のチームが1位を獲得したのは、このうちのトータルスコアだ。
カシオと信州大学のジョイントチームがランキング1位と表示されている。ISIC 2017のWebサイトで見られる |
主催側は、試験データの600枚とは別に、AIを鍛えるために以下のデータを提供している(合計2,000枚、すべて性別と年齢の情報を付与)。また、参加者は各自で症例画像を用意して、機械学習に利用しても構わないことになっている(要申告)。
- 人工知能をディープラーニングで学習させるためのデータ(Training Data)として、正解の疾患名付きの症例画像を2,000枚。
- 途中経過確認用のバリデーションデータ(Validation Data)として、正解の疾患名が付かない症例画像を150枚。
主催側では、学習用データを2016年12月9日に公開し、バリデーションデータと試験データを年明けの2017年1月7日に公開した。ただし、後述するが、試験データは途中で変更されている。
途中経過確認用のバリデーションデータは、判定結果をアップロードするとトータルのスコアが参加者全員に分かるようになっており、判定とアップロードは何度でも行える。つまり、参加者は自分たちのAIがどの程度ブラッシュアップできているか相対評価でき、納得がいくまでAIを鍛えられる仕組みだ。
コンテストには世界中から22チームが参加。各国の大学や法人、医療機関、あるいはそれらの混成チームなどが多く、人工知能の研究を専門とする大手企業なども名を連ねていた。