*1  Plagger の FetchNicoVideo で遊ぶ

やり方はほぼそのままなので割愛。マイリストの代わりに http://zio3.net/nicoRss/Handler.ashx を使った程度か。しばらく試行錯誤して遊んでいたら .flv 取得に失敗するようになって、何だと思ってブラウザからログインしてみたら「おめーは短時間にダウンロードしすぎなんだよ! 自重しる」と怒られた。FFmpeg を通せばエンコードの時間が適度にダウンロード間隔になるんだろうが、FLVダウンロードのみで使う場合は注意した方が良さそう。

ところでこの flv は当然ながら再生時のコメントが無い訳で、ニコニコ的には面白さの半分も活用してないんだろうな。

*2  nicovideo の flv 変換

で、後段で Filter::FFmpeg に食わせて m4v にしようとしたが、日本語ファイル名を食ってくれずにこける。ソース見る限りは FetchNicoVideo ではちゃんと指定した euc-jp で書き込みしてくれていて、後段の FFmpeg も文字コードをちゃんと見ているようなんだが、はて。ファイル名を perl の one liner を通して ffmpeg に渡しても動くので、やっぱりモジュールのどこかでまずいことしてるんだろう。後でもう少し調べる。

WiredVision の全文入りAtom

Posted by yoosee on Web at 2007-09-22 22:00 JST

*1  WiredVision の全文入りAtom

WiredVision は Palm で読んでいたが、試しに es でも読めるように Plagger で全文入りAtomを生成した。config.wiredvision.yml は以下のように。global 部分は省略。
plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://pheedo.wiredvision.jp/f/wiredvision_atom

  - module: Filter::StripRSSAd
  - module: Filter::ResolveRelativeLink
  - module: Filter::Rule
    rule:
      - module: RecentN
        count: 20

  - module: Filter::EntryFullText
    config:
      force_upgrade: 1

  - module: Publish::Feed
    config:
      dir: /home/www/yoosee.net/test/plagger/feeds
      filename: wiredvisionjp.xml
モバイル機器で読む用には、広告排除の StripRSSAd がとても便利。

CMS を使っているからだろうが、切り出し用の asset は非常に単純。news も blog もこれでいける。
assets/plugin/Filter-EntryFullText/wiredvision_jp.yaml
author: yoosee
handle: http://pheedo\.wiredvision\.jp/
extract: <div id="body">(.*?)<!-- id="entry_text"-->
久しぶりに Plagger をいじったけど、やっぱ便利だし面白いしよく出来てるよなぁ。

*1  Asahi.com から全文入りフィードを生成

これも基本的な使い方。Asahi.com の RSS にはタイトルしか含まれないので、EntryFullText で全文を引っこ抜いてフィードを作る。もちろん再配布はよろしくないので、認証をかけて es の pRSSreader で読むためのみに使っている。以下、設定用 yaml ファイル。global の辺りは省略。
plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://www3.asahi.com/rss/index.rdf
  - module: Filter::Rule
    rule:
      - module: Deduped
  - module: Filter::EntryFullText
    config:
      store_html_on_failue: 1
      force_upgrade: 1
  - module: Filter::StripRSSAd
  - module: Filter::Regexp
    config:
      regexp: s/rss\.asahi\.com/www\.asahi\.com/g
  - module: Publish::Feed
    config:
      format: RSS
      dir: /somewhere/htdocs/plagger/feeds
      filename: asahicom.rdf


pRSSreaderでPlaggerで生成したAsahi.com全文フィードを表示生成先は http で閲覧可能なところにしておき、認証をかける。pRSSreader 側に登録すれば出来上がり。と言うわけで問題無く表示できた。cron で 30分おきに実行して更新するように仕掛けておく。なかなか便利。

*2  2007-01-30 追記

description に webbug らしき a と img の html が入るようになったので、force_upgrade オプションを追加して対応。

*3  2007-09-22 追記

画像URL正規化のための Filter::Regexp と広告削除のための Filter::StripRSSAd を追加。

*1  しげふみメモ:PlaggerでAmazonアソシエイトレポートをGmailへ送る

これもほぼそのまま。Amazon のレポート画面にログインして内容を閲覧するというのを自動化できる。こういうのは Plagger の最も基本的な使いかただろう。一週間に一通位の頻度にしようと思ったけど現状だとレポートページの種類は選べないのか。
Google Adsense レポートを以下略は無いのかなと思ったけど、そもそもカスタムビューのレポートメール生成機能があるから必要ないのだな。Amazon も自身で提供すべき機能だと思うんだが。

*1  やどりぎ@NET: PlaggerでYouTubeの注目されている動画をPodcastに登録する

実は以前に getmovie.rb を書いたときに後でやろうと思っていたことを殆どそのままやられてしまっていたので、しめしめとそのまま真似する。svn の最新版にも Filter::FFmpeg が無く、irc で聞いてみたら mizzy.org/Plagger/Plugin/Filter/FFmpeg.pm を教えていただきそちらから入手。CPAN から FFmpeg::Command を持ってきて設定。ffmpeg 自体は nerim.net から持ってきていた気がする。あとは path 等を除いて一緒。

実行すると特に youtube からのダウンロードに結構な時間がかかるので夜中にでも定期実行するのがよさそう。自動的に 注目リスト取得 → flvダウンロード → フォーマット変換 → RSS 作成 をしてくれるのは感動的に便利。これで es や palm の TCPMP で見るのも簡単になる。これぞ Plagger といった感じ。問題(?)は、はてなの注目動画って殆どがネタ動画なことかな。

Plagger を導入

Posted by yoosee on Web at 2006-10-12 23:42 JST

*1  Plagger

Plaggerそろそろ Plagger をいじっておかないと時代に取り残されるのでは無いかと言う気がしたので、とりあえずインストールだけしてみた。Debian での入れかた は基本的には apt 一発なので簡単。assets は
svn co http://svn.bulknews.net/repos/plagger/trunk/plagger/assets
から持ってきておく。ヨタの日々 2006-09-15 | mixi => Plagger => Gmail を参考に mixi 日記を gmail に流すのはさくっと出来た。

ぱっと見でも Plugin 構造やレシピの作り方などよく出来てると感心してしまう。ただこれだけだと mecanize.rb で mixi diary を自動取得する の方が(個人的には)使いやすいんだよね。何か面白い使い方が無いか考えてみよう。新聞サイトのニュース記事を全文入りで自分向けフィードしてみようかな。そう言えば Publish::PalmDoc があるようだけど、Publish::Plucker も欲しいところ。

*1  それPla(ry Plannet

本文やコメントに それPla と言う単語があったら取得してくる Plannet があったらどうかなーと、それだけのネタ。

そう言えば休み中に Plagger を入れてみようと思って調べてみると、Debian なら
deb http://debian.hansode.org/ ./
を /etc/apt/sources.list に入れればいいと言うことが分かったんだけど、いざ入れる段になったら CPAN package を 100 個以上入れようとすることにびびって中断したのだった。ぼちぼち諦めて(なにを?)入れるかな。

About W.W.Walker

World Wide Walker は yoosee による blog です。PDA, Web・サーバ技術, 美味しい食べ物などの話題を取り上げています... read more

Monthly Archives

Select Month to read
  

Ads

Recent Entries

Related Sites