Google、情報爆発に対応する新検索システム『Caffeine』開発完了

ニュース
トップ

Google、情報爆発に対応する新検索システム『Caffeine』開発完了

Junya Suzuki  [2010/06/10]

米Googleは6月8日(現地時間)、新検索システム『Caffeine』の開発完了を発表した。Caffeineはインデックス化(索引)を行うシステムで、これにより従来の検索結果の50%が新しいものにリフレッシュされることになるという。今日のインターネットはページやアップデート、メディアタイプなど、さまざまな種類の情報が爆発的に増え続けているが、これらをより高速に処理し、より適切な結果を瞬時に反映するための仕組みとなる。

Googleが示すCaffeineの概念図。正直いってこれだと違いがよくわからないが、実は圧倒的な性能差が……

Caffeineにおけるその最大の特徴は、情報リフレッシュのスピードだ。例えば従来のインデックスシステムでは、情報処理のために複数のレイヤーで構成され、主となるレイヤーでは数週間単位でアップデートが行われている。リフレッシュにあたってはWeb全体の解析から行われるため、情報が実際に更新されたタイミングからユーザーの検索結果に反映されるまで、どうしてもタイムラグが生じる。もっとも、Google検索の場合、このインデックス更新の速度は現時点でも競合より十分速いわけなのだが……。

ところが新システムのCaffeineでは全体の解析は行わず、データ全体のごく一部を個々に解析し、つねに検索インデックスの更新を続けている。クローラが新しいページを発見する、あるいは既存ページの中に新しい情報を発見した段階で、これらをすぐにインデックスに反映できるわけだ。このリアルタイム情報収集と反映がCaffeineの特徴となる。

Googleによれば、このインデックス処理をすべきWebページ全体の量は膨大で、Caffeineでは毎秒何十万ものWebページを並行処理可能だという。1データベースあたりのストレージ容量は1億ギガバイトで、これに毎日数十ギガバイト単位の新規データが追加されている。このデータ量に対応するには、最大容量のiPodが62万5,000台は必要になるという。同社は未来を想定してCaffeineを構築したとコメントしているが、これだけでも情報処理の最先端の世界の一端がうかがえるのではないだろうか。なお、このCaffeineによる高速インデックスの成果は数ヶ月内にも実際の検索システムに反映されることになるという。

関連キーワード

特別企画 [PR]

一覧

    人気記事

    一覧

    イチオシ記事

    新着記事

    農水は新潟、環境が富山 - サミット閣僚8会合発表へ
    [02:00 7/3] 共同通信
    マンCジェコがローマと個人合意か…移籍金調達へ3選手売却検討も
    [01:28 7/3] ライフ
    C大阪MF長谷川アーリアジャスール、サラゴサへ移籍「突然の報告」
    [00:31 7/3] ライフ
    超音波で微細なバリを一度に取る「超音波バリ取り洗浄装置」
    [00:00 7/3] エンタープライズ
    「俺物語!!」更なる増量で撮影に挑む鈴木亮平「猛男の優しさ表現したい」
    [00:00 7/3] ホビー

    特別企画 [PR]

    一覧