ニコニコ動画を Plagger で fetch して遊ぶ
Posted by yoosee on Web at 2007-09-24 22:00 JST1 Plagger の FetchNicoVideo で遊ぶ
やり方はほぼそのままなので割愛。マイリストの代わりに http://zio3.net/nicoRss/Handler.ashx を使った程度か。しばらく試行錯誤して遊んでいたら .flv 取得に失敗するようになって、何だと思ってブラウザからログインしてみたら「おめーは短時間にダウンロードしすぎなんだよ! 自重しる」と怒られた。FFmpeg を通せばエンコードの時間が適度にダウンロード間隔になるんだろうが、FLVダウンロードのみで使う場合は注意した方が良さそう。ところでこの flv は当然ながら再生時のコメントが無い訳で、ニコニコ的には面白さの半分も活用してないんだろうな。
2 nicovideo の flv 変換
で、後段で Filter::FFmpeg に食わせて m4v にしようとしたが、日本語ファイル名を食ってくれずにこける。ソース見る限りは FetchNicoVideo ではちゃんと指定した euc-jp で書き込みしてくれていて、後段の FFmpeg も文字コードをちゃんと見ているようなんだが、はて。ファイル名を perl の one liner を通して ffmpeg に渡しても動くので、やっぱりモジュールのどこかでまずいことしてるんだろう。後でもう少し調べる。WiredVision の全文入りAtom
Posted by yoosee on Web at 2007-09-22 22:00 JST1 WiredVision の全文入りAtom
WiredVision は Palm で読んでいたが、試しに es でも読めるように Plagger で全文入りAtomを生成した。config.wiredvision.yml は以下のように。global 部分は省略。plugins: - module: Subscription::Config config: feed: - url: http://pheedo.wiredvision.jp/f/wiredvision_atom - module: Filter::StripRSSAd - module: Filter::ResolveRelativeLink - module: Filter::Rule rule: - module: RecentN count: 20 - module: Filter::EntryFullText config: force_upgrade: 1 - module: Publish::Feed config: dir: /home/www/yoosee.net/test/plagger/feeds filename: wiredvisionjp.xmlモバイル機器で読む用には、広告排除の StripRSSAd がとても便利。
CMS を使っているからだろうが、切り出し用の asset は非常に単純。news も blog もこれでいける。
assets/plugin/Filter-EntryFullText/wiredvision_jp.yaml
author: yoosee handle: http://pheedo\.wiredvision\.jp/ extract: <div id="body">(.*?)<!-- id="entry_text"-->久しぶりに Plagger をいじったけど、やっぱ便利だし面白いしよく出来てるよなぁ。
Plagger で全文入り RSS を生成して W-ZERO3[es] で購読
Posted by yoosee on Web at 2006-10-24 23:42 JST1 Asahi.com から全文入りフィードを生成
これも基本的な使い方。Asahi.com の RSS にはタイトルしか含まれないので、EntryFullText で全文を引っこ抜いてフィードを作る。もちろん再配布はよろしくないので、認証をかけて es の pRSSreader で読むためのみに使っている。以下、設定用 yaml ファイル。global の辺りは省略。plugins: - module: Subscription::Config config: feed: - url: http://www3.asahi.com/rss/index.rdf - module: Filter::Rule rule: - module: Deduped - module: Filter::EntryFullText config: store_html_on_failue: 1 force_upgrade: 1 - module: Filter::StripRSSAd - module: Filter::Regexp config: regexp: s/rss\.asahi\.com/www\.asahi\.com/g - module: Publish::Feed config: format: RSS dir: /somewhere/htdocs/plagger/feeds filename: asahicom.rdf
生成先は http で閲覧可能なところにしておき、認証をかける。pRSSreader 側に登録すれば出来上がり。と言うわけで問題無く表示できた。cron で 30分おきに実行して更新するように仕掛けておく。なかなか便利。
2 2007-01-30 追記
description に webbug らしき a と img の html が入るようになったので、force_upgrade オプションを追加して対応。3 2007-09-22 追記
画像URL正規化のための Filter::Regexp と広告削除のための Filter::StripRSSAd を追加。Plagger で Amazon アソシエイトレポートをメール
Posted by yoosee on Web at 2006-10-20 23:42 JST1 しげふみメモ:PlaggerでAmazonアソシエイトレポートをGmailへ送る
これもほぼそのまま。Amazon のレポート画面にログインして内容を閲覧するというのを自動化できる。こういうのは Plagger の最も基本的な使いかただろう。一週間に一通位の頻度にしようと思ったけど現状だとレポートページの種類は選べないのか。Google Adsense レポートを以下略は無いのかなと思ったけど、そもそもカスタムビューのレポートメール生成機能があるから必要ないのだな。Amazon も自身で提供すべき機能だと思うんだが。
Plagger で YouTube の注目動画をPodcastに変換
Posted by yoosee on Web at 2006-10-17 23:42 JST1 やどりぎ@NET: PlaggerでYouTubeの注目されている動画をPodcastに登録する
実は以前に getmovie.rb を書いたときに後でやろうと思っていたことを殆どそのままやられてしまっていたので、しめしめとそのまま真似する。svn の最新版にも Filter::FFmpeg が無く、irc で聞いてみたら mizzy.org/Plagger/Plugin/Filter/FFmpeg.pm を教えていただきそちらから入手。CPAN から FFmpeg::Command を持ってきて設定。ffmpeg 自体は nerim.net から持ってきていた気がする。あとは path 等を除いて一緒。実行すると特に youtube からのダウンロードに結構な時間がかかるので夜中にでも定期実行するのがよさそう。自動的に 注目リスト取得 → flvダウンロード → フォーマット変換 → RSS 作成 をしてくれるのは感動的に便利。これで es や palm の TCPMP で見るのも簡単になる。これぞ Plagger といった感じ。問題(?)は、はてなの注目動画って殆どがネタ動画なことかな。
Plagger を導入
Posted by yoosee on Web at 2006-10-12 23:42 JST1 Plagger
そろそろ Plagger をいじっておかないと時代に取り残されるのでは無いかと言う気がしたので、とりあえずインストールだけしてみた。Debian での入れかた は基本的には apt 一発なので簡単。assets はsvn co http://svn.bulknews.net/repos/plagger/trunk/plagger/assetsから持ってきておく。ヨタの日々 2006-09-15 | mixi => Plagger => Gmail を参考に mixi 日記を gmail に流すのはさくっと出来た。
ぱっと見でも Plugin 構造やレシピの作り方などよく出来てると感心してしまう。ただこれだけだと mecanize.rb で mixi diary を自動取得する の方が(個人的には)使いやすいんだよね。何か面白い使い方が無いか考えてみよう。新聞サイトのニュース記事を全文入りで自分向けフィードしてみようかな。そう言えば Publish::PalmDoc があるようだけど、Publish::Plucker も欲しいところ。
それPla(ry Plannet と言うのはどうだろう
Posted by yoosee on Web at 2006-08-24 23:42 JST1 それPla(ry Plannet
本文やコメントにそれPlaと言う単語があったら取得してくる Plannet があったらどうかなーと、それだけのネタ。
そう言えば休み中に Plagger を入れてみようと思って調べてみると、Debian なら
deb http://debian.hansode.org/ ./を /etc/apt/sources.list に入れればいいと言うことが分かったんだけど、いざ入れる段になったら CPAN package を 100 個以上入れようとすることにびびって中断したのだった。ぼちぼち諦めて(なにを?)入れるかな。