Google、情報爆発に対応する新検索システム『Caffeine』開発完了

ニュース
トップ

Google、情報爆発に対応する新検索システム『Caffeine』開発完了

Junya Suzuki  [2010/06/10]

米Googleは6月8日(現地時間)、新検索システム『Caffeine』の開発完了を発表した。Caffeineはインデックス化(索引)を行うシステムで、これにより従来の検索結果の50%が新しいものにリフレッシュされることになるという。今日のインターネットはページやアップデート、メディアタイプなど、さまざまな種類の情報が爆発的に増え続けているが、これらをより高速に処理し、より適切な結果を瞬時に反映するための仕組みとなる。

Googleが示すCaffeineの概念図。正直いってこれだと違いがよくわからないが、実は圧倒的な性能差が……

Caffeineにおけるその最大の特徴は、情報リフレッシュのスピードだ。例えば従来のインデックスシステムでは、情報処理のために複数のレイヤーで構成され、主となるレイヤーでは数週間単位でアップデートが行われている。リフレッシュにあたってはWeb全体の解析から行われるため、情報が実際に更新されたタイミングからユーザーの検索結果に反映されるまで、どうしてもタイムラグが生じる。もっとも、Google検索の場合、このインデックス更新の速度は現時点でも競合より十分速いわけなのだが……。

ところが新システムのCaffeineでは全体の解析は行わず、データ全体のごく一部を個々に解析し、つねに検索インデックスの更新を続けている。クローラが新しいページを発見する、あるいは既存ページの中に新しい情報を発見した段階で、これらをすぐにインデックスに反映できるわけだ。このリアルタイム情報収集と反映がCaffeineの特徴となる。

Googleによれば、このインデックス処理をすべきWebページ全体の量は膨大で、Caffeineでは毎秒何十万ものWebページを並行処理可能だという。1データベースあたりのストレージ容量は1億ギガバイトで、これに毎日数十ギガバイト単位の新規データが追加されている。このデータ量に対応するには、最大容量のiPodが62万5,000台は必要になるという。同社は未来を想定してCaffeineを構築したとコメントしているが、これだけでも情報処理の最先端の世界の一端がうかがえるのではないだろうか。なお、このCaffeineによる高速インデックスの成果は数ヶ月内にも実際の検索システムに反映されることになるという。

関連したタグ

    マイナビニュースのセミナー情報

    オススメ記事

    マイナビニュースの集合特集

    関連サイト

    新着記事

    転職ノウハウ

    あなたの仕事適性診断
    あなたの仕事適性診断

    4つの診断で、自分の適性を見つめなおそう!

    Heroes File ~挑戦者たち~
    Heroes File ~挑戦者たち~

    働くこと・挑戦し続けることへの思いを綴ったインタビュー

    はじめての転職診断
    はじめての転職診断

    あなたにピッタリのアドバイスを読むことができます。

    転職Q&A
    転職Q&A

    転職に必要な情報が収集できます

    ドS美人面接官 vs モテたいエンジニア
    ドS美人面接官 vs モテたいエンジニア

    入室しようとしたら、マサカリ投げられちゃいました!?

    特別企画

    一覧

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      一覧

        求人情報