検索ポータルYahoo! JAPANを運営するヤフーは24日、高次元高速検索技術「NGT(Neighborhood Graph and Tree for Indexing)」を開発、オープンソースとしてGitHubで公開した。
NGTは、テキストや画像に商品やユーザーデータなど複数の特徴を持つ高次元データを大量のデータベースから高速に検索できる技術で、同社では最先端の学術領域における既存の類似技術の主流と比較して12倍以上の高速検索が可能になるとしている。
2015年9月より「Yahoo! JAPAN研究所」において、商用不可の研究用途限定で公開していたが、社内外を問わず多くのデータサイエンティストとともに技術を発展させていくため、特許実施権を無償提供の上オープンソースで公開している。
同社では高次元データの高速検索が可能になると大きく分けて2つの応用可能性が考えられるとしている。
1つは、AIなどで近似したデータのマッチングの高速化を図れることで、スピード向上が精度向上につながる。同社のサービスのとしては、スマートフォン用のYahoo! JAPANアプリのニュースなどのパーソナライズ配信、運用型ディスプレイの広告配信の精度向上への応用などを例示している。もう1つが、フォーマットや入力方法も異なる大量データを高速照合し、データの名寄せなど企業内にたまるデータを活用できる形へと置き換え、質の高いビッグデータ生成を例示している。
NGTを活用した「サイヤスカメラ」を試験的にYahoo!ラボで公開(iOSのみ)しており、スマートフォンカメラで任意の商品に向けてかざすと「Yahoo!ショッピング」内の商品ページのなかから最安値で扱うストアを表示できる。
同社ではメディア、コマース、決済など国内最大級のユーザーを抱えるサービスを提供。多くのビッグデータを抱えており、このような"マルチビッグデータ"を保持する企業として、その利活用のために"技術で世界TOP10"を掲げるとともに、大学や研究機関、OSSコミュニティなどオープンなコラボレーションを推進。今後もOSSコミッターとしてコミュニティ活性化に向けてノウハウを提供していくとしている。