Praggerの動作は、config.yamlというファイルに利用するプラグインとその設定を記述することで制御します。ここでは、「マイコミジャーナルのRSSから「【コラム】」のみを抽出し、column.rssとして保存する」という動作をするconfig.yamlを作成してみましょう。

まず、Praggerで利用できるプラグインを調べてみます。Praggerをチェックアウトしたディレクトリで次のように入力します。

$ ./pragger --listplugin
...
grep
...
load_rss
...
save_rss
...

--listplugin」オプションを使うと、インストールされているプラグインが全て表示されますので、この中から使えそうなプラグインを探します。今回は、load_rssプラグインとgrepプラグイン、save_rssプラグインを利用すれば良さそうです。

プラグインの使い方は次のようにして調べます。

$ ./pragger --pluginusage load_rss
Load RSS from given URLs -- IKeJI

Load RSS from given URLs.
If "url" is an Array, all URLs in the array will be loaded.

- module: load_rss
  config:
    uri: http://www.example.com/hoge.rdf

--pluginusage」オプションを使うと、プラグインの説明、開発者、簡単なサンプルが表示されます。grepプラグインとsave_rssプラグインについても、それぞれ使い方を確認してみてください。

最終的には、config.yamlは次のようになります。

- module: load_rss
  config:
    url: http://journal.mycom.co.jp/haishin/rss/index.rdf
- module: grep
  config:
    regex: "【コラム】"
- module: save_rss
  config:
    filename: column.rss
    link: http://journal.mycom.co.jp/column/
    title: MYCOMジャーナル【コラム】

それでは実行してみましょう。

$ ./pragger
exec plugin load_rss
exec plugin grep
exec plugin save_rss

実行後、column.rssというファイルが作成されていれば、成功です! 以下の画面写真はFirefoxでcolumn.rssを開いたところで、きれいに整形された画面ではありませんが、コラムだけが抽出されていることが確認できます。

Firefoxでcolumn.rssを開いたところ。コラムだけが抽出されていることが分かる