ヤフー(Yahoo! JAPAN)は11月15日、数十万の選択肢の中から適切な解を、世界最速かつ高精度に予測するというAI(機械学習)技術である「AnnexML(アネックスエムエル)」を、オープンソースソフトウェア(OSS)として公開した。

既存技術との高速性の比較

新技術は、ユーザーのサービス利用情報などのビッグデータと、そのユーザーがクリックした広告をはじめ数十万の選択肢との組み合わせを効率的に学習でき、「サービス利用情報のあるユーザーに対して、どの広告がクリックされやすいか」といった有力な候補の組み合わせを予測するという。

同社は、個々のユーザーに合わせて数十万の選択肢の中から適切な解を掲出するコマースや広告のパーソナライズ機能において、同技術が精度向上に有効と考えており、今後サービスへの応用を検討している。

同技術を同種のビッグデータ分類技術と比較検証した結果、既存技術の中で多様な研究が引用している「SLEEC」(Microsoft Research, India、Indian Institute of Technologyの研究者らによる技術)と比べ、最大で約58倍の予測速度を記録し、論文投稿時点である2017年2月における世界最速の技術になったという。

AnnexMLの処理フロー

同技術では、同社が提供するAI技術関連のOSSでもある高速検索技術「NGT」を用いて、項目数を数十に圧縮したビッグデータをグラフ構造に整理・学習することにより、高い予測精度の条件下においても高速化を実現している。

詳細については、2017年8月にカナダで開催したデータマイニング領域の国際会議(トップカンファレンス)である「KDD2017」において、論文として発表した。同技術は、導入後の特許侵害の発生リスクを抑え、安心して利用してもらうため、特許権を取得したという。

研究用途のみならず商業用途も含め、その特許権のライセンスを無償提供する形で、11月15日からGitHub上に公開した。OSS公開を通じて、同技術のさらなる利便性向上を図り、データサイエンス領域の研究者・エンジニアコミュニティに貢献していく。

同社は「マルチビッグデータ」の保持に加えて、その利用のために「技術で世界TOP10」を掲げ、データサイエンス領域における先端研究・開発も推し進めているという。 特に、大学や研究機関との共同研究やAI技術関連のOSS公開など、アカデミア領域への情報発信を強化しているといい、同技術のOSS公開もその取り組みの一環とのことだ。