Google、情報爆発に対応する新検索システム『Caffeine』開発完了

ニュース
トップ

Google、情報爆発に対応する新検索システム『Caffeine』開発完了

Junya Suzuki  [2010/06/10]

米Googleは6月8日(現地時間)、新検索システム『Caffeine』の開発完了を発表した。Caffeineはインデックス化(索引)を行うシステムで、これにより従来の検索結果の50%が新しいものにリフレッシュされることになるという。今日のインターネットはページやアップデート、メディアタイプなど、さまざまな種類の情報が爆発的に増え続けているが、これらをより高速に処理し、より適切な結果を瞬時に反映するための仕組みとなる。

Googleが示すCaffeineの概念図。正直いってこれだと違いがよくわからないが、実は圧倒的な性能差が……

Caffeineにおけるその最大の特徴は、情報リフレッシュのスピードだ。例えば従来のインデックスシステムでは、情報処理のために複数のレイヤーで構成され、主となるレイヤーでは数週間単位でアップデートが行われている。リフレッシュにあたってはWeb全体の解析から行われるため、情報が実際に更新されたタイミングからユーザーの検索結果に反映されるまで、どうしてもタイムラグが生じる。もっとも、Google検索の場合、このインデックス更新の速度は現時点でも競合より十分速いわけなのだが……。

ところが新システムのCaffeineでは全体の解析は行わず、データ全体のごく一部を個々に解析し、つねに検索インデックスの更新を続けている。クローラが新しいページを発見する、あるいは既存ページの中に新しい情報を発見した段階で、これらをすぐにインデックスに反映できるわけだ。このリアルタイム情報収集と反映がCaffeineの特徴となる。

Googleによれば、このインデックス処理をすべきWebページ全体の量は膨大で、Caffeineでは毎秒何十万ものWebページを並行処理可能だという。1データベースあたりのストレージ容量は1億ギガバイトで、これに毎日数十ギガバイト単位の新規データが追加されている。このデータ量に対応するには、最大容量のiPodが62万5,000台は必要になるという。同社は未来を想定してCaffeineを構築したとコメントしているが、これだけでも情報処理の最先端の世界の一端がうかがえるのではないだろうか。なお、このCaffeineによる高速インデックスの成果は数ヶ月内にも実際の検索システムに反映されることになるという。

特別企画

一覧

    人気記事

    一覧

    イチオシ記事

    新着記事

    『ねんどろいど 桜ミクダヨー』発売决定&4月30日予約開始、ミクダヨーも再販
    [20:20 4/26] ホビー
    [℃-ute]ハロプロ初 メキシコで単独ライブ開催へ
    [19:50 4/26] エンタメ
    ぢたま(某)の家族4コマがコミックガムに登場。高槻ナギー、Boichiも新連載
    [19:30 4/26] ホビー
    [大塚愛]出産を経て「深くて切ないラブソングが書けるようになった」
    [19:28 4/26] エンタメ
    のばらあいこのサイン会レポがCabに、表紙は「秋山くん」続編
    [18:52 4/26] ホビー

    特別企画

    一覧