Google、情報爆発に対応する新検索システム『Caffeine』開発完了

ニュース
トップ

Google、情報爆発に対応する新検索システム『Caffeine』開発完了

Junya Suzuki  [2010/06/10]

米Googleは6月8日(現地時間)、新検索システム『Caffeine』の開発完了を発表した。Caffeineはインデックス化(索引)を行うシステムで、これにより従来の検索結果の50%が新しいものにリフレッシュされることになるという。今日のインターネットはページやアップデート、メディアタイプなど、さまざまな種類の情報が爆発的に増え続けているが、これらをより高速に処理し、より適切な結果を瞬時に反映するための仕組みとなる。

Googleが示すCaffeineの概念図。正直いってこれだと違いがよくわからないが、実は圧倒的な性能差が……

Caffeineにおけるその最大の特徴は、情報リフレッシュのスピードだ。例えば従来のインデックスシステムでは、情報処理のために複数のレイヤーで構成され、主となるレイヤーでは数週間単位でアップデートが行われている。リフレッシュにあたってはWeb全体の解析から行われるため、情報が実際に更新されたタイミングからユーザーの検索結果に反映されるまで、どうしてもタイムラグが生じる。もっとも、Google検索の場合、このインデックス更新の速度は現時点でも競合より十分速いわけなのだが……。

ところが新システムのCaffeineでは全体の解析は行わず、データ全体のごく一部を個々に解析し、つねに検索インデックスの更新を続けている。クローラが新しいページを発見する、あるいは既存ページの中に新しい情報を発見した段階で、これらをすぐにインデックスに反映できるわけだ。このリアルタイム情報収集と反映がCaffeineの特徴となる。

Googleによれば、このインデックス処理をすべきWebページ全体の量は膨大で、Caffeineでは毎秒何十万ものWebページを並行処理可能だという。1データベースあたりのストレージ容量は1億ギガバイトで、これに毎日数十ギガバイト単位の新規データが追加されている。このデータ量に対応するには、最大容量のiPodが62万5,000台は必要になるという。同社は未来を想定してCaffeineを構築したとコメントしているが、これだけでも情報処理の最先端の世界の一端がうかがえるのではないだろうか。なお、このCaffeineによる高速インデックスの成果は数ヶ月内にも実際の検索システムに反映されることになるという。

特別企画

一覧

    人気記事

    一覧

    イチオシ記事

    新着記事

    完熟メロン果汁を加えた「カルピス メロン」、今年も期間限定で登場
    [21:28 3/31] ライフ
    新戦力躍動で5発快勝、ハリルホジッチ体制連勝…青山・宇佐美・川又A代表初得点
    [21:15 3/31] ライフ
    堀北真希、東京メトロ企業広告に2015年度も出演 - 第1弾は上野にフォーカス
    [21:13 3/31] 旅行
    Kingston、UHS-IIに対応したUSB 3.0接続の4in1カードリーダ
    [21:11 3/31] パソコン
    [テレビ朝日]サイバーエージェントと新会社設立 定額制の動画配信「Abema」開始へ
    [21:10 3/31] エンタメ

    特別企画

    一覧