Google、情報爆発に対応する新検索システム『Caffeine』開発完了

ニュース
トップ

Google、情報爆発に対応する新検索システム『Caffeine』開発完了

Junya Suzuki  [2010/06/10]

米Googleは6月8日(現地時間)、新検索システム『Caffeine』の開発完了を発表した。Caffeineはインデックス化(索引)を行うシステムで、これにより従来の検索結果の50%が新しいものにリフレッシュされることになるという。今日のインターネットはページやアップデート、メディアタイプなど、さまざまな種類の情報が爆発的に増え続けているが、これらをより高速に処理し、より適切な結果を瞬時に反映するための仕組みとなる。

Googleが示すCaffeineの概念図。正直いってこれだと違いがよくわからないが、実は圧倒的な性能差が……

Caffeineにおけるその最大の特徴は、情報リフレッシュのスピードだ。例えば従来のインデックスシステムでは、情報処理のために複数のレイヤーで構成され、主となるレイヤーでは数週間単位でアップデートが行われている。リフレッシュにあたってはWeb全体の解析から行われるため、情報が実際に更新されたタイミングからユーザーの検索結果に反映されるまで、どうしてもタイムラグが生じる。もっとも、Google検索の場合、このインデックス更新の速度は現時点でも競合より十分速いわけなのだが……。

ところが新システムのCaffeineでは全体の解析は行わず、データ全体のごく一部を個々に解析し、つねに検索インデックスの更新を続けている。クローラが新しいページを発見する、あるいは既存ページの中に新しい情報を発見した段階で、これらをすぐにインデックスに反映できるわけだ。このリアルタイム情報収集と反映がCaffeineの特徴となる。

Googleによれば、このインデックス処理をすべきWebページ全体の量は膨大で、Caffeineでは毎秒何十万ものWebページを並行処理可能だという。1データベースあたりのストレージ容量は1億ギガバイトで、これに毎日数十ギガバイト単位の新規データが追加されている。このデータ量に対応するには、最大容量のiPodが62万5,000台は必要になるという。同社は未来を想定してCaffeineを構築したとコメントしているが、これだけでも情報処理の最先端の世界の一端がうかがえるのではないだろうか。なお、このCaffeineによる高速インデックスの成果は数ヶ月内にも実際の検索システムに反映されることになるという。

関連サイト

特別企画

一覧

    人気記事

    一覧

    イチオシ記事

    新着記事

    アニメ「旦那が何を言っているかわからない件 2スレ目」キービジュアル公開
    [00:00 3/6] ホビー
    平本アキラ「監獄学園」TVアニメ、今夏スタート!「巨悪学園」とのコラボも
    [00:00 3/6] ホビー
    [水原希子]瑛太とキレキレダンス ピンヒールで華麗に
    [00:00 3/6] エンタメ
    [ヒバナ]「IKKI」後継マンガ誌が誕生 大人の「妖怪ウォッチ」や東村アキコの新作も
    [00:00 3/6] ホビー
    [東村アキコ]「海月姫」作者が“女謙信”のマンガを連載
    [00:00 3/6] ホビー

    特別企画

    一覧