Praggerの動作は、config.yamlというファイルに利用するプラグインとその設定を記述することで制御します。ここでは、「マイコミジャーナルのRSSから「【コラム】」のみを抽出し、column.rssとして保存する」という動作をするconfig.yamlを作成してみましょう。
まず、Praggerで利用できるプラグインを調べてみます。Praggerをチェックアウトしたディレクトリで次のように入力します。
...
grep
...
load_rss
...
save_rss
...
「--listplugin」オプションを使うと、インストールされているプラグインが全て表示されますので、この中から使えそうなプラグインを探します。今回は、load_rssプラグインとgrepプラグイン、save_rssプラグインを利用すれば良さそうです。
プラグインの使い方は次のようにして調べます。
Load RSS from given URLs -- IKeJI
Load RSS from given URLs.
If "url" is an Array, all URLs in the array will be loaded.
- module: load_rss
config:
uri: http://www.example.com/hoge.rdf
「--pluginusage」オプションを使うと、プラグインの説明、開発者、簡単なサンプルが表示されます。grepプラグインとsave_rssプラグインについても、それぞれ使い方を確認してみてください。
最終的には、config.yamlは次のようになります。
config:
url: http://journal.mycom.co.jp/haishin/rss/index.rdf
- module: grep
config:
regex: "【コラム】"
- module: save_rss
config:
filename: column.rss
link: http://journal.mycom.co.jp/column/
title: MYCOMジャーナル【コラム】
それでは実行してみましょう。
exec plugin load_rss
exec plugin grep
exec plugin save_rss
実行後、column.rssというファイルが作成されていれば、成功です! 以下の画面写真はFirefoxでcolumn.rssを開いたところで、きれいに整形された画面ではありませんが、コラムだけが抽出されていることが確認できます。