今回のテーマは「検索」

日頃からお世話になっている検索エンジン。必要な情報を即座に探し出して、提供してくれる。もはや"検索エンジンがなかったら、仕事にならない"という人が多い時代なのではないだろうか。

そんな便利な検索エンジンではあるが、何もGoogle/Yahoo!/MSN/gooをはじめとするインターネット全体を対象とした全文検索エンジンだけがすべてではない。ある目的に限定することで、大手の検索エンジンにはない、魅力的な情報を提供してくれるものも存在する。

今回はそんな検索エンジンに注目してお届けしたい。必要に応じて使い分けることで、適切な情報をすばやく得られるようになるはずだ。

今回紹介するOSS・Webアプリ
UNdata』 国連の統計情報データベース
書店在庫一括検索』 近所の書籍在庫を検索
OpenGrok』 Java製のソースコード検索
Google Hacks』 Googleの怪しい使い方



信頼性の高い統計データを探す

名称 UNdata
URL http://data.un.org/Default.aspx

"ある国に関する情報"を収集しようと思ったときにはどうするのがよいだろうか。簡易的な情報であればWikipediaで事足りるだろう。だがその信頼性を担保するものがなかったら利用が難しい。その点、『UNdata』で検索できる情報は国連が運営しているだけあって、信頼性は高いものになっている。

「UNdata」のトップページ。国名や欲しい情報のキーワードを使って検索できる

国名で検索すると、人口/GDP/人口成長率/平均寿命/二酸化炭素の排出量が一覧表示される。なおデータは2006年や2000~2005年のものになっているので若干古い。その他、通貨単位や国連加盟日、経済関連の情報などさまざまな情報を取得できる。信頼性の高さでは申し分ないので、海外展開を考える際や渡航前にその国について知っておきたいといったときにも利用できそうだ。

Japanの検索結果。若干古いが、信頼性は高い

United Statesの検索結果。さまざまな公式データが取得可能




徒労はゴメンです! 複数書店の在庫を検索

名称 書店在庫一括検索
URL http://tech.openvista.jp/stock/

インターネット書店とは異なり、リアル店舗では目的の書籍がその場になければ、取り寄せてから再度購入しに行く必要がある。筆者はよく書店に行くのだが、目的の本がなくて残念な思いをした経験が度々ある。これでは時間と機会のロスだ。

『書店在庫一括検索』では、近所にある紀伊国屋/旭屋書店/ジュンク堂書店の書籍在庫を一括検索し、在庫の有無をリストアップしてくれる。これであらかじめ調べておけば、在庫がなくてがっかりするようなことはなくなる。

「書店在庫一括検索」のトップページ。ISBNがわかる場合その番号を、わからない場合は書籍名や著者名を入力する

使い方は簡単で、書籍のISBNをベースに各書籍サイトの検索を行っている。ISBNがわからない場合は、まずAmazon Web Serviceを使って該当書籍をリストアップしてくれるので、そこから欲しい本を選べばよい。対応している書店に限られるが、配置棚もわかるので希望の書籍をすぐに探し出すことができる。

検索結果例。店舗ごとの在庫状況が一覧される

ネットの書店はもちろん便利だが、リアルの店舗で多数の本に囲まれながら色々な書籍を漁ってみるのもまた楽しいものだ。書店在庫一括検索を使ってガッカリ感をなくしつつ、書店に足を運んでみよう。




ソースコードでも検索エンジンを活用

名称 OpenGrok
URL http://www.opensolaris.org/os/project/opengrok/

多人数で開発していると、見覚えのない関数や定数が出てきたりしてシステム全体の見通しが悪くなる。都度、Grepしてソースコードを洗い出すようではあまりに非効率的だ。ここではソースコードを検索できるシステムの導入を提案したい。

『OpenGrok』は各種バージョン管理システム(Mercurial/RCS/CVS/Subversion/Teamware)に対応したソースコード検索エンジンだ。検索結果に出てくるコードは多数の言語に対応したハイライト機能で見やすく表示される。関数はクリックすると再度検索が実行されてリストアップされる。

検索結果。結果をクリックすると、該当ソースが表示される

検索項目が多く、orやandを使って高度な検索が可能になっている。修正日によって範囲を決めるられるほか、更新履歴の閲覧も可能だ。OpenGrokを使えば開発作業がより効率的に行なえるようになるだろう。

ソースコードを表示しているところ。言語に応じてハイライト化される




Googleをディープに使いこなす

名称 Google Hacks
URL http://code.google.com/p/googlehacks/

Googleは世界中の公開データのインデックス化を行なっている。その膨大なデータの中には、あまり公開するのはよろしくないデータも存在している。そして、検索クエリを工夫すると、そういったデータの検索も可能になる。

とはいえ、そうした検索クエリは複雑で、いちいち手入力するのには向かない。では我々は貴重なデータを前に検索をあきらめるしかないのだろうか。いや、あきらめられない人がいた。それがGoogle Hacksの開発者たちだ。『Google Hacks』は簡単にいえばGoogle検索用のクエリ生成ソフトウェアだ。WindowsやMac OSX、Linuxで動作する。

Google Hacksのメイン画面。キーワードと種類を選択してSearchボタンを押すだけだ

使い方は簡単で、検索キーワードと種類を指定するだけでよい。たとえば、Musicを選択すると、デフォルトでMP3やWMAが検索対象になる。あとは検索を実行すれば、デフォルトのWebブラウザでそのURLが開かれる。その際のURLは非常に長いものになっている。これが必要なデータをうまく抽出するための仕組みだ。

検索結果の一例。普段は使わないであろう特殊な検索キーワードが使われている

もちろん、ダウンロード、ご利用は自己責任の上でお願いしたい。悪意のあるファイルの場合ももちろん考えられるのでくれぐれもご注意を。

いかがでしたか?

検索エンジンは今のインターネットの世界では欠かせない存在だ。だが、常に大手のエンジンというわけでなく、目的やデータの内容に応じて使い分けるほうが効率的だ。また、検索エンジンの良さを知っていればこそ、ソースコード検索エンジンのように違う目的の中でも検索エンジンを活かせるようになる。

書籍、写真、音楽、動画、テキスト、ブログ……探すべき情報はさまざまに存在する。それぞれに適した検索エンジンを探しておくと、いざというときに便利そうだ。

著者プロフィール
MOONGIFT 中津川 篤司(なかつがわ あつし)
1978年生まれ。オープンソース紹介サイト「MOONGIFT」管理人。プログラマ、SE、ITマネージャを経て、オープンソースのビジネス活用を推進する。現在は独立し、Webサービスのコンサルティング、プロデュースを行う。