一般物体認識精度世界一を奪還-大阪府立大生開発のニューラルネットワーク

大阪府立大学は、同大の開発したニューラルネットワークが、一般物体認識分野で世界一の精度を達成したことを発表した。同大は2016年にも、世界一の精度を達成していたが、2017年5月に「Snake-Snake」という手法に記録を抜かれていたため、今回、世界一の称号を奪還したこととなる。

同成果は、同大の山田良博氏(博士後期課程)と岩村雅一准教授、黄瀬浩一教授によるもの。研究内容は、熊本大学で開催された「電子情報通信学科パターン認識・メディア理解(PRMU)研究会」で発表された。

一般物体認識の認識率の推移(CIFAR-100データセットを用いた場合) (出所:大阪府立大学Webサイト)

一般物体認識とは、さまざまな物体を認識するタスクのことで、近年では、ディープラーニングで注目されているニューラルネットワークを用いた手法が主流となっている。同分野の研究開発は盛んに行われており、主なものだけで過去約2年間に11回も記録が塗り替えられている。

また、この一般物体認識手法を、画像からの物体切り出しや画像の領域分割などといった、画像に関連するタスクのエンジンとして利用するパターンも増えている。これらのタスクでは手法に用いるエンジンを性能の良いものに置き換えることで、手法を高性能にできると知られているため、認識性能の高い一般物体認識手法の提案は、一般物体認識のタスクに限らず、画像に関連するタスクへの大きな波及効果が期待できる。

一般物体認識手法は、深い構造を持つネットワーク「Deep」と広い構造を持つネットワーク「Wide」に大別できるといい、これらを比較すると、深い構造をもつネットワークの方が、メモリの使用量に直結するネットワークのパラメータ数が比較的小さくて済む上に、認識性能が高いという結果が出ていた。

深い構造を持つネットワーク(Deep)と広い構造を持つネットワーク(Wide)の性能比較(CIFAR-100データセットを用いた場合) (出所:大阪府立大学Webサイト)

今回、研究グループは「学習を適度に妨害する」学習法を、深い構造をもつネットワークに適用する形で実現。また、その過程で学習が安定する工夫も導入しているという。これらの技術を、前回同大が開発した手法に適用することで、再び世界一の認識精度を達成した。従来世界一だった手法と比べ、その認識率は約3%向上し、88%の認識精度を達成したという。