gooラボ、第3世代検索サービスの実験開始 - ニュースのトピック語を提供

NTTレゾナント副社長 中嶋孝夫氏

NTTサイバーコミュニケーション総合研究所所長 宮部博史氏

NTTとNTTレゾナントはポータルサイト「goo」の「gooラボ」上で、第3世代検索サービスの公開共同実験を行うと発表した。同社によれば第1世代検索を手動によるディレクトリ提供、第2世代検索をbotによるWeb自動収集とキーワード検索、第3世代検索を「人にやさしい検索」と位置付け、情報と出会うことを支援するナビゲーション型検索サービスの提供を担う。

NTTサイバーソリューション研究所(以下SL研)が開発した技術をもとに以下の4つの
実験を開始する。

  • 検索支援実験「トピック・マスター(TopicMaster)」
  • ブログ検索実験「ブログスコープ」
  • パーソナライズ実験「パーソナルサマリ」
  • 最新話題提示実験「ホットウィンドウ+(HotWindow+)」

SL研は、必要なときに必要な情報に必要な形で出会えるための技術として、(1)探すこと(2)気付くこと(3)自分流にすること--を軸とする「サイバー・ナビゲーション技術」の研究開発を進めており、実際のサービス化に結びつけるために、より多くのユーザーに使用してもらい、新技術のサービス性の検証を進める狙い。ポータルサイト「goo」としてもSL研の新技術を導入して3大ポータルとしての地位の確立を目指す。

ナビゲーション・プロジェクトの「探す」「気づく」「自分流にする」の3軸。緑の丸が次に追加予定の公開実験のようだ。

ニュース記事分類・検索実験「トピック・マスター(TopicMaster)」

ニュース記事に対するキーワード検索結果の中から共通する主要なトピックを発見し、このトピックを元に、検索結果を更に分類して提示する。右側にカテゴリごとの重要トピックスが並ぶため、「どういう単語で検索していいか分からない」といった状態のユーザーの検索の絞り込み作業を支援する。

たとえば「地震」で検索してみると、従来の検索結果の右側にトピックがカテゴリ分類されて一覧される

「新潟県中越地震」関係の記事が検索され「長岡市」などの場所や、人物として「小泉純一郎」、組織として「気象庁」などが抽出されている。

手法的には、検索結果から固有名詞などのラベルを抽出し(固有表現抽出技術)、それぞれのラベルの優先度をスコア付けし、「人物」「場所」「組織」といったカテゴリに分類する。スコア付けの手法としては、検索結果に含まれる固有表現を「検索結果中での重要性」「検索条件との関連性」の2つの基準を利用する。

カテゴリ分類に関しては、たとえば固有名詞には「渋谷」など地名と人名の両方の可能性がある言葉があるが、同社によれば文脈を判断して分類をするようだ。続いて並ぶ助詞の情報や周辺に並ぶ単語などで総合的に判断するようで、このようなトピックを提供する検索エンジンを搭載したポータルサイトは同社によれば世界初だという。日本語版ベータテスト中のGoogle Newsはニュース記事のカテゴリ分類は提供するが、記事間に関連するトピックの提供は行っていない。

ユーザーにニュース記事のカテゴリ分類を行って、さらにトピックを提供することで、検索結果の全体像が把握しやすくなり、トピックを手がかりに速やかに目的の情報を探すことが可能になる。なお、実験期間は2004年10月26日~2005年1月末を予定している。

ブログ検索高度化実験「ブログスコープ」

最近話題のブログサイトが提供している新着情報の全文検索や、類似したブログ記事の検索、特に話題になっている記事の検索を効率よく行う機能を提供する。

ブログサイトの検索はgooのブログサイト以外にも、はてなダイアリーなど主なブログサイトも検索対象となっている。これまでのブログ検索サービスは、各ブログからRSSとして提供されている概要文を対象とした検索にとどまっていたが、本実験ではブログ記事の全文検索を可能にしている。ブログは個人が感覚的に文章を記述するためサマリーでは内容が反映されないと同社では判断している。

さらに検索されたブログ記事の「似ている記事を探す」というリンクをクリックすることで、似たような内容を含んでいる別のブログサイトの記事を検索することもできる(高効率類似文書検索エンジンを使用)。

そのほか、ブログサイトが記事内で引用しているURLの重複数をカウントすることで「今、話題になっている記事」のランキングを表示する機能も提供する(最近2日間の統計)。実験期間は2004年10月26日~2005年1月末を予定している。

「今、話題になっている記事」では「はてな義援金」のページが引用数トップになっていた。このようなURL被リンク数をカウントするサービスは海外のblogdex、Daypopや、国内ではblogmap、NEWSLinksなどがある

ウェブページパーソナライズ高度化実験「パーソナルサマリ」

「パーソナルサマリ」の例。ユーザー登録が必要

左側のカテゴリリストからドラッグ&ドロップで右側に設置する。レイアウトも自由に変更可能だ(DynamicHTMLで実現)

個人の好みに合わせ、情報を自由にクリッピングできるパーソナライズ環境を提供する。ブラウザ表示のRSSリーダとして実現される機能で、登録されているカテゴリの中から、ウォッチしておきたいブログサイトやニュース記事などを指定し、ドラッグ&ドロップで簡単に自分好みのレイアウトの組み合わせで表示させることができる。レイアウト表示はDynamicHTMLでテーブルを組み替えることで実現しているため、同機能をサポートするブラウザに限られる。実験期間は2004年10月26日~2005年3月末の予定。

最新話題提示実験「ホットウィンドウ+(HotWindow+)」

HotWindow+の例。時間ともともに自動更新される。SL研ではロビーに大画面で設置して話題を提供しているとのこと。

表示するカテゴリやジャンルは自由に設定できる。HotWindow+はスクリーンセーバー版も配布されている

ニュースサイトやブログサイト等に掲載されている最新の話題をキーワードとして抽出し、話題のニュースがカテゴリごとにトピックを円形に囲む方式でグラフィカルに表示する機能になる。自動リロードで更新されるため、画面に表示させておけば、今、世の中で話題になっている最新情報を常に傍観することが可能になる。Flashを用いるため、テキストベースのインタフェースも用意されている。コンセプトである「話題に気づく」を実現する技術になる。実験期間は2004年10月26日~2005年2月末の予定。

右下でホットペッパー(?)が踊っている

今後の展開

今後、実験で得られたデータを基に、サービス性評価の検証を行いながら、別の新サービス実験の追加も行う予定で、現時点で詳細は明らかにされていないが、投入する新実験の詳細は決定しているようだ。2005年初旬ごろまで実験を続け、有望なものはビジネス化も検討するほか、「gooラボ」の学術機関等へのオープン化も想定している。



転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

求人情報