「いまその場で起きていること」をリアルタイムに収集する、"リアルタイム検索エンジン"というジャンルが盛り上がりつつある。対象となるのはブログやWebニュース、SNSなどで、まさにリアルタイムでホットな話題を知ることができる。6月18日(米国時間)にスタートした新サービス『Collecta』も、そうしたリアルタイム検索の分野を開拓する挑戦者の1人だ。
先日、GoogleがTwitterなどのマイクロブログ検索の分野進出の準備を進めていることを紹介したが、これもまたリアルタイム検索のひとつだ。Twitterなどのマイクロブログは「いま身近で起きている出来事」が投稿されることが多く、特に大きなイベントがある場合にはそのトピックに関連した投稿が爆発的に増えることになる。一般に、情報が更新され、それをGoogleなどの検索エンジンがWebサイトの巡回(クローリング)を行って情報を収集、インデックス化が完了するまでにかかる時間は最短で数十分、長くて数日~数週間程度の時間がかかる。
だが、今まさに起きている出来事を把握するリアルタイム検索にはほど遠く、この周期を縮めることがミッションのひとつとなっている。ここで話題に上っているTwitterも自身で"リアルタイム検索"のサービスを提供しているが、例えばTechCrunchの記事では「"リアルタイム"をうたっているにも関わらず、"3時間程度"の誤差がある」とインデックス化におけるラグの大きさを揶揄している。
今回登場したCollectaは、こうした"リアルタイム"におけるラグの解消を目指したサービスのひとつとなる。使い方は簡単だ。Collectaのページにアクセスして、特定のキーワードを入力して検索するだけだ。すると検索エンジンが動き出し、検索を開始した時間から現在までにWeb上(ブログ/ SNS系サービスなど)に出現した"当該キーワードを含む記事"の抽出を始める。抽出は"リアルタイム"で行われ、時間の経過とともに当該キーワードを含む記事の見出しが追加されていく。見出しをクリックすると右側にプレビューが表示され、さらに記事を読みたい場合はリンクから記事本体へとジャンプできる。検索を行ったキーワードは画面左側に次々と追加されていき、バックグラウンドで抽出された記事の本数がキーワード横に数字として表示される。人気の高いトピックほど数字が多くなるというわけだ。また「Hot now」の項目で人気の高い検索キーワードがつねに更新されており、最新トピックを追いかけることもできる。
使い方にクセがあるため、いままでの検索エンジンの感覚では使いにくいが、つい数秒前に追加されたばかりの記事でさえ検索結果に出現する様子はある意味で感動だ。