Googleの検索機能は秘密のベールに覆われている。同社の使っている基本的な検索アルゴリズムは同社の創設者であるLarry Page氏とSergey Brin氏によって開発されたPageRankアルゴリズムだが、これがすべてではない。同社は検索サービスの競争力維持と、検索アルゴリズムを公開することでそれを逆手にとって悪用されるのを防止する目的で検索機能の詳細は公開していない。しかし、すべてを秘密のベールに隠しておくことは好ましくないという認識はもっているようだ。

20日(米国時間)、Google Search Quality, VP Engineering, Udi Manber氏は検索品質を向上させることに責務をおいたSearch Qualityというチームが存在することを紹介し、すべてではないものの新機能や変更点、古い技術、アドバイスなどを今後定期的に公開していくことを発表した。同氏はGoogleに2年以上在籍しているが、検索技術には20年たずさわっているという。

ランキングは人々が考えている以上に困難なものだと同氏は説明する。言語がそもそも本質的に曖昧であり、文章にも明確な規則がない。情報を伝達する標準規約もないため、すべてのWebページを解析し誰がなんの理由で作成したものかを調査しておく必要がある。さらに少ない検索ワードから何を意図して検索が実施されているかを汲み取る必要がある。そういったすべての処理を数ミリ秒のうちに完了しなければならないわけだから大変だ。

興味深いのは同氏が同氏らの経験から、ムーアの法則が18カ月ごとに計算速度を倍々で伸ばすことを示しているように、明確にどこかに記載されているわけではないものの、短時間に処理する困難なクエリの複雑性も倍々で伸びていると指摘していることだ。計算処理が高速になればなるほど、複雑性も向上しているということだ。

Googleではエンジニアが新しいアイディアを思いつきアルゴリズムを開発すると、同アイディアを徹底的に検証するという。同社には統計学者で構成された評価チームが組織されており、その新しいアイディアが有益なものであるかどうかをチェックしているという。2007年の実績では450の改善が実施されたとされている。1週間に平均で9の改善が実施されている計算になる。改善点はシンプルで明らかなものから、複雑で入り組んだものまで様々ということだ。最近の取り組みとしては、特に多言語のサポートを進めたことがあげられている。

検索アルゴリズムに関して詳しい説明はなかったが、今後発表される内容でいくつかは説明されていくのではないかとみられる。巨大で高速な検索サービスを提供しているGoogleの頭脳がどうなっているのか垣間見えるという点で興味深いところだ。今後の同氏の発表に注目しておきたい。