【レポート】

ICADL2006 - 雑誌データベースを5年で構築!? GeNiiスタート中

3 論文は引用の壮大なリンクツリー

    美崎薫  [2006/12/23]

    検索結果には雑誌の記事もあった

    ICADLの会場で、じっさいに、筆者自身の論文を対象に、検索をしてもらった。即座に筆者の関連する論文がリストアップされ、アブストラクト(要約)まで見ることができた。知らないうちにこんなことまで行われているとは……。

    おもしろかったのは、論文誌に投稿したものだけでなく、通常の月刊誌に寄稿した記事までもリストされていることだった。つまり、スタートは学術誌だが、データベースの制限を学術誌に限るつもりはない、ということを意味しているのである。

    もしもこのままプロジェクトが順調に進めば、学術誌の次は当然「全雑誌」へと広がる可能性がある。可能性というのは、別に筆者がそういっているだけでなく、国立情報学研究所じたいも、それを目標としていると、羽田氏はいう。

    GeNiiで論文を検索してみた。知らないうちにリストができていてびっくり。リストのなかには一般雑誌の記事もあった

    GeNiiで検索した論文を表示する。論文の著作権によって表示できる内容は異なっているが、書誌データは見ることができる

    引用データベース

    論文のなかでおもしろいのは、引用データベースを作っていることである。研究というのは積み重なっていくものなので、つねに先行する研究を引用していくものだ。

    たとえば、最近のユビキタスコンピューティングでは、マーク・ワイザーの論文がかならず引用されることになっている。ライフログであれば、ヴァネヴァー・ブッシュのMemexの論文がかならず筆頭に引用される。

    論文の場合、いわば引用で、壮大なリンクツリーの構造ができているわけである。

    GeNiiではこの引用を解析して、リンクをたどれるようにしている。リンクは、被リンク数の順番に論文をリストして、どの論文が重要であるかを見ることができたりする。この引用リストはユーザーに好評だそうだ。

    たしかに、通常論文を読んで引用論文が出てきても、その内容を直接その場ですぐに知ることはできない。別途論文を探す必要があるのだ。GeNiiではこの手間がない。たいへん便利である。

    全雑誌を5年で

    「全雑誌を5年で」と羽田氏は目標を設定する。

    もちろんこれは、先に述べたように、楽観的リップサービスなところもないではない。というかある。

    手始めは学会誌。といっても、日本に存在するという全3,000学会のうち、協力体制をとれているのはまだ500学会にすぎないともいう。数は充分多い。2005年4月の時点で17,000誌・950万論文。はたしてこれをどう評価するか。

    Googleが全書籍をデジタル化しつつあるこの時代、全雑誌(全学会誌)をデジタル化してデータベース化することは、Googleに負けない価値を作り出すことにつながるだろう。

    こんなチャンスはめったにあるものではなく、ひょっとすると最初で最後かもしれない。全雑誌をデータベース化してしまえば、ほかにデータベース化する雑誌はもうないのだから。だれかがやるのなら、国立情報学研究所がやってもよい。

    書籍と雑誌が終われば、残るのは、フリーペーパー、チラシ、パンフレットなどとなるだろう。これらがどのくらいあるかは予想もつかないが、全書籍、全雑誌となれば、当然その次に来るのはこういうことになるだろう。

    ぜひ全学会誌、そして全雑誌へと範囲を広げていきたいと思う。

    ただし、気になるのはこのデータベースを活用するには、有料の会員になる必要があることであり、資格は研究機関に在籍することときわめて限られることである。ひょっとすると、Googleがすべてをひっくり返すこともありうる。そのくらいGoogleには勢いがある。5年では遅すぎるかもしれないのであるし、有料のビジネスモデルも時代遅れかもしれない。

    いよいよほんとうに、すべての人間の知識が、検索可能になるXデーは迫っている。

    関連記事

    関連サイト

    新着記事

    特設サイトの情報

      人気記事

      一覧

      イチオシ記事

      新着記事

      特別企画

      マイナビニュースマガジン