富士通研究所は9月19日、学習に必要な量のデータを取得できない場合にも、高精度な判断が可能な機械学習技術「Wide Learning」を開発したことを発表した。

従来のディープラーニングをベースとしたAIは、判断したい対象のデータ(正解データ)を十分に含む大量のデータを学習させることにより、高精度の判断を実現していたが、実際の現場では判断したい対象データが極端に足りない場合が少なくない。

このような場合、未知のデータに対する高精度の判断を実現することは困難であるほか、従来のディープラーニングをベースとしたAIの学習モデルはブラックボックス型のモデルで、AIの判断理由を説明できないという透明性の問題があるという。

今回、同社が開発した技術では、データの項目どうしをすべて組み合わせ、その大量の組合せを仮説として、重要度の高いものを選別する。

さらに、仮説を構成する項目の重複関係に基づいてそれぞれの影響度を制御することで、どの仮説に対しても均等に学習することができ、データに偏りがある場合でも従来よりも高精度な判断を下すことが可能となるという。

また、仮説は論理的な表現で記述されているため、人間にも判断理由を理解することができるとしている。

UC Irvine Machine Learning Repositoryのマーケティングと医療領域のベンチマークデータを用いたテストでは、ディープラーニングに比べて正解データを当てる精度が約10~20%向上し、サービスに加入する見込みの高い客や罹患患者を見逃す確率を約20~50%低減することを達成したという。

今回、約5000件の顧客データの中で購入顧客が約230件と正解データが少ないマーケティングのデータを使ったところ、同技術を用いて販促する人を決めると、見込み顧客を販促対象から外す数をディープラーニングの分析結果である120人から74人と減らすことができたという。