前回「AIにた぀わる倧きな誀解を解きたしょう」の最埌に、次のように曞きたした。

けれども、開発コストの内蚳を芋れば、「蚭蚈、プログラミング」の工皋が「デヌタ収集、正解ラベルタグの付䞎」の工皋に眮き換わり、倧きな郚分を占めるようになったこずがわかりたす。

か぀おは科孊的・数孊的にアルゎリズムを組み立おられた郚分が、半ばダマ勘に近いかたちで、経隓則に䟝存しお正解デヌタ䜜りの苊劎をしなければならなくなったこずを忘れおはならないのです。

䞊蚘を螏たえお甚心するに越したこずはありたせん。かずいっお、無甚の䞍安に駆られ、「AIではビゞネス目暙の蚭定などできないのか なら、他瀟では䜿えおもうちでは導入できないな」などず早蚈に刀断しおしたうのも、みすみす競争力匷化のチャンスを倱うもったいない結果ずなるかもしれたせん。

技術にしおも事業にしおも、その成吊を評䟡し、刀断するには数倀目暙が必芁です。手曞文字認識などで、「やっおみたら、結果99%の粟床が出た」などのニュヌスはたたにありたすが、いわゆる未来予枬、技術ロヌドマップの類いで、数倀目暙を明蚘したものはめったに芋たせん。先の「99%」の意味、すなわち、「これで䜕ができるのか」「それは十分な粟床なのか」「業務フロヌに組み蟌んで、経枈合理性のある掻甚アむディアがあるのか」などが蚘された理性的な報道も寡聞にしおあたり芋た蚘憶がありたせん。

長幎、情報系のさたざたな研究分野の最新成果を芋おきたしたが、評䟡指暙、特に粟床を自ら適切に評䟡しようずしない分野䟋えば「゚ンタヌテむンメント」ず蚀い切っおしたうなどの研究は衰退したす。改善されたか吊かが評䟡できないのだから、圓然でしょう。

これたでにも、人間の感芚や盎芳で捉えた品質画質などが良くなるずか、ほずんど同じ品質のたたデヌタ量削枛圧瞮できたなど、評䟡が困難な研究分野もありたした。これらの研究領域では、䞻芳評䟡・官胜評䟡が必芁なため、評䟡がずおも困難なこずもあったず聞きたす。

しかし、それを乗り越えるため、評䟡方法に぀いお深く、フェアに研究しおラむバル同士、意芋亀換やベンチマヌク評䟡デヌタの亀換、共有を行うようにした分野では、足螏み状態から抜け出しお、技術の進歩が再開したす。

画像圧瞮で有名な、叀い少女のベンチマヌク画像(このペヌゞの右䞊)を芋るたびにこのこずを思い出し、䜕十幎ず誠実に研究を積み重ねおきた先人の努力に頭の䞋がる思いがしたす。JPEG芏栌などがこのような努力の末に制定されたずいう経緯などは、䞀般ナヌザヌは忘れおも構いたせん。しかし、我々、優れたITを吟味・遞別し、効果的に採甚を働きかける立堎の者は、敬意を持っお枩故知新の努力を振り返っおみるこずも必芁かず思いたす。

画像認識・分類の粟床を評䟡する「再珟率」ず「適合率」

筆者も執筆に携わった英語の抂念蟞曞「WordNet」をベヌスに構築された「ImageNet」は、5䞇人が6幎間かけお1,370䞇枚の画像に正解タグ写真に写っおいる物の名前を付䞎し、事実䞊それを唯䞀の神矅䞇象の正解画像デヌタベヌスずするこずで、人類共通の、AIトレヌニング資産ずなりたした。それずずもに、䞀定比率で、評䟡甚の正解タグ付き画像を切り出すこずで、暙準ベンチマヌク評䟡デヌタも兌ねおいたす。

2010幎以降、このImageNetから1,000の物の名前を取り出しお画像認識・分類コンテストの象城ずなっおいる「ImageNet Large Scale Visual Recognition Competition (ILSVRC) 」では、䞖界䞭から競争者が珟れ、幎々目芚たしく粟床が向䞊。人間も、キツネず猫を間違えたりするケヌスがあるこずを思うず、最近は「平均粟床で人間を超えた」ずする評䟡もありたす。

このような健党に技術向䞊をもたらす評䟡指暙粟床には、「再珟率」ず「適合率」の2皮類がありたす。定矩は明快です。図のように、本圓の正解集合「A」に察しお、システムが「正解猫なら猫」ず出力したものの割合「H/A」が再珟率。システムの出力党おの集合「S」に察しお、本圓の正解でもあった「H」の比率、「H/S」が適合率です。

適合率ず再珟率

狭い意味での「粟床」ずは、適合率のこずです。「システムによる勇み足」「誀りの少なさ」などず蚀い換えおみるず、盎芳的に意味を芚えやすいかず思いたす。同様に、再珟率は「取りこがしの少なさ」「カバレヌゞ」ず蚀い換えおみるず腑に萜ちるこずでしょう。

先のJPEG画像の品質評䟡ず比べお、最近のディヌプラヌニングによる䜕らかの認識タスク・分類タスクの評䟡は難しいでしょうか? 決しおそんなこずはなく、正解集合さえ定矩できおいれば、䞊述の適合率ず再珟率によっお、綺麗に粟床評䟡・比范評䟡をするこずが可胜です。

「最近流行のAIの評䟡は、他の技術に比べお、かなり容易である」ずいう蚀い方をしおも構わないでしょう。にもかかわらず、AI分野では、䌝統的に少々奇をおらったような新芏の研究テヌマで、定性的な成果のみが匷調され、センセヌショナルな話題を打ち出そうずする傟向が吊めないように思いたす。

少し長くなりたしたので、次回、AI開発コストの䞻芁郚分を占めるようになった「正解デヌタ䜜り」に焊点を圓お、それが、ROI (Return of Investment) を巊右するこずなどに぀いお論じたいず思いたす。たた、AIを組み蟌んだ新業務フロヌのなかで、人間がAIの出力をどのようにサポヌトしたり、最終刀断したりするかによっお目暙粟床が倧きく倉わるこずを、具䜓的な事䟋を芋ながら解説しおいく予定です。

著者玹介

野村盎之


野村盎之 - メタデヌタ株匏䌚瀟 代衚取締圹瀟長 理孊博士

NEC䞭倮研究所、MITマサチュヌセッツ工科倧孊人工知胜研究所、ゞャストシステム、リコヌなどを経お05幎にメタデヌタを創業。人間がより人間らしい仕事に集䞭できるよう、深局孊習などのAIを含む高床なアルゎリズム、デヌタ分析ツヌルでホワむトカラヌを支揎する䜿呜を果たすべく日々奮闘䞭。