【レポート】

ICADL2006 - Google Book Search技術担当者が語るデジタルアーカイブ

1 Google Book Searchの驚異

    美崎薫  [2007/01/09]

    人類の知=書物すべてを検索可能へ

    サーチエンジンを手始めに、Google マップ、Gmailと多角展開しつつ、売り上げの90%を広告から得ている広告企業Google。そのGoogleが目標に掲げるのが、これまでの人類の知すべてを検索可能にすることである。

    具体的にGoogleが進めているプロジェクトが、これまでに刊行された書物すべてをスキャンしてデジタル化し、OCRでテキスト化、検索可能にする「Google Book Search」(日本では「Google ブック検索」)である。

    Googleは、アメリカ内外の大学図書館や公共図書館と協力して、全書籍のデジタル化を進めている。パートナーには、ハーバード大学、ミシガン大学、カリフォルニア大学、オックスフォード大学、スタンフォード大学、ニューヨーク公共図書館などが名を連ねる。ちなみに、それぞれの蔵書には日本の出版社の蔵書も含まれていて、それらも分け隔てなくスキャンの対象となっている。

    このGoogle Book Searchには、驚かされるところがいくつもある。

    ひとつは、ブルドーザー的なスキャンの規模である。

    もうひとつは、著作権への対応である。

    ご存じかと思うが、筆者は『記憶する住宅』というプロジェクトで、これまでに約100万ページのデータをスキャンおよびデジタル写真によって蓄積してきた。1冊200ページの書物として換算すると、だいたい5,000冊分に相当する。これは個人の規模としては充分大きいが、Googleのやろうとしている規模にはとうてい及ばない。というか、Googleの全書籍のスキャンと比較すると、ドン・キホーテ的な香りもする。

    全書籍とは、なんとも勇ましいというか、うらやましいというか、いったい、これはどういうことなのだろうか。

    米GoogleのBook Searchプロジェクトの技術責任者であるDaniel Clancy(ダニエル・クランシー)氏が来日して講演した。

    紅葉の美しい京都で行われたICADL2006

    米Googleのブックスキャンプロジェクトの技術責任者であるDaniel Clancy氏

    参考:

    新着記事

    特設サイトの情報

      人気記事

      一覧

        イチオシ記事

        新着記事

        特別企画

        マイナビニュースマガジン