*1  Asahi.com から全文入りフィードを生成

これも基本的な使い方。Asahi.com の RSS にはタイトルしか含まれないので、EntryFullText で全文を引っこ抜いてフィードを作る。もちろん再配布はよろしくないので、認証をかけて es の pRSSreader で読むためのみに使っている。以下、設定用 yaml ファイル。global の辺りは省略。
plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://www3.asahi.com/rss/index.rdf
  - module: Filter::Rule
    rule:
      - module: Deduped
  - module: Filter::EntryFullText
    config:
      store_html_on_failue: 1
      force_upgrade: 1
  - module: Filter::StripRSSAd
  - module: Filter::Regexp
    config:
      regexp: s/rss\.asahi\.com/www\.asahi\.com/g
  - module: Publish::Feed
    config:
      format: RSS
      dir: /somewhere/htdocs/plagger/feeds
      filename: asahicom.rdf


pRSSreaderでPlaggerで生成したAsahi.com全文フィードを表示生成先は http で閲覧可能なところにしておき、認証をかける。pRSSreader 側に登録すれば出来上がり。と言うわけで問題無く表示できた。cron で 30分おきに実行して更新するように仕掛けておく。なかなか便利。

*2  2007-01-30 追記

description に webbug らしき a と img の html が入るようになったので、force_upgrade オプションを追加して対応。

*3  2007-09-22 追記

画像URL正規化のための Filter::Regexp と広告削除のための Filter::StripRSSAd を追加。

( Permalink | Comments (0) | tags: plagger  es  )
World Wide WalkerPlagger で全文入り RSS を生成して W-ZERO3[es] で購読  Plaggerを使って、RSS上にタイトルしか表示されないものに対しても全文を引き抜き、pRSSリーダー上で確認するための手段が述べられています。Asahi.comなどのニュースサイト用にこういうRSS.......
Comments

Please write your comment. email address won't appear. Cannot use any HTML tags in comment.
コメントをお書き下さい。メールアドレスは公開されません。 またHTMLタグは利用できません。
Name   E-mail   URL
Comment

About W.W.Walker

World Wide Walker は yoosee による blog です。PDA, Web・サーバ技術, 美味しい食べ物などの話題を取り上げています... read more

このエントリーのブックマーク

Monthly Archives

Select Month to read