February 4 Mon, 2008
Twitter がデータセンタを NTT America に移したらしい
Posted by yoosee on Web at 2008-02-04 18:00 JST1 Twitter Chooses NTT America Enterprise Hosting Services
ちょっと話題が古いが、Tech Crunch Japanese に TwitterとJoyent、 ダウンタイムの苦悩の最中にお別れ と言う記事が載っていて、Twitter の新しいホスト先が Verio になったと報じられている。whois で IPアドレスを見てみると、確かに Verio というか NTT America のサービスになっているようだ。% host twitter.com twitter.com has address 128.121.146.100 % whois 128.121.146.100 OrgName: NTT America, Inc. ....Twitter もオフィシャルに Twitter Chooses NTT America Enterprise Hosting Services というプレスリリースを出していたようだ。ちなみに Enterprise Hosting は元々 Verio のサービスだったものを、今は NTT America が巻き取ったもの。
で、このデータセンタ移動について、NTTがTwitterに投資したから だなんて話が出ている。確かにNTTはほぼ同じタイミングで国内外ベンチャー投資ファンド設立を発表してるので、この動きに合わせて NTT America の関係者が動いたなんて言う見方も出来なくはないのかも。本当だとしたら驚きだけど。
余談ながら Twitter のニュースリリースの中で、少し前の台湾地震の際に発生した海底ケーブル障害の復旧でNTTコムが48時間以内に90%まで回復させたと言う話を載せていて、この話は意外とあちこちで品質評価の事例として挙げられているみたい。
February 10 Sun, 2008
Twitter 検索で餃子を検索してみると
Posted by yoosee on Web at 2008-02-10 13:00 JST1 Twitter 検索で餃子を検索してみた
Twitter検索でトレンドグラフが使えるようなので、「餃子」「ギョーザ」について検索してみた。ついでに「毒」も。グラフは貼付けしやすいようにちょっと改変させていただいた。ニュースになった30日のピークはさすがにすごいが、Twitter検索: 餃子 を見る限り、みんなもう餃子食いまくりで、あちこちで餃子オフとか開催されてるの。見てらんない。ついでに GoogleTrendsの結果 も。大体似たような傾向か。ギョーザと言う単語が30日に突然出てるのは、何故か幾つかのマスコミがそういう表記をしていたからかな。
なおうちも一昨日は天龍で餃子を食いました。実際今回の騒動で影響を受けた餃子屋は多いだろうけど、多少はポジティブな効果も出てるといいんだけどね。
February 12 Tue, 2008
300 (スリーハンドレッド)
Posted by yoosee on Review at 2008-02-12 18:00 JST1 300(スリーハンドレッド)
たった300人で100万人のペルシア軍に立ち向かったスパルタ兵の話。ストーリーはあってないようなもんで、とにかく熱い戦闘シーンが素晴らしい。なんというか、実写版三国無双と言う感じ。個々のスパルタ戦士の奮闘がダイナミックにえがかれている。アメコミ原作と言うこともあり、史実やイデオロギー的な部分を考えるとあまり楽しめない気がするので、歴史背景を忘れてアクションを楽しむスタンスで見るべきかと思う。なお最後の最後はもう少し奮戦してから死んでほしかった気はする。4/5点。ちなみに実際のテルモピュライの戦いの記載を見るに
とのことで、荒唐無稽のようで政治的背景はともかく戦闘に関しては意外と史実に近いっぽい。なんで半裸なのかと思ったけど、歴史資料ほとんどそのままの格好なのね。不死部隊なる精鋭部隊も実在だそう。スパルタ重装歩兵の300人とテバイ、テスピアイ兵1,100人の合計1,400人(またはスパルタの装甲歩兵1,000人を加えて2,400人)は、共にテルモピュライに残った。
夜明けを待って、レオニダスは全軍に出撃を命令した。それまでは、街道の城壁での防衛を主としていたが、この日は道幅の広い場所まで進撃した。彼らは槍が折れると剣で、剣が折れると素手や歯を使い、全軍が玉砕するまで戦った。ヘロドトスによれば、この戦いによるペルシア軍の戦死者も2万人にのぼったとされる。
1 プラダを着た悪魔 (特別編) (ベストヒット・セレクション) [DVD]
全般的にテンポがすごくよくて大変面白い。舞台となる "RUNAWAY"誌編集長ミランダのモデルはもちろん VOGUE 編集長アナ・ウィンターなわけだが、これをメリル・ストリープが恐ろしくハマリ役で演じてる。アンドレアが次々にハイブランドの服を着こなすシーンの曲がマドンナのヴォーグというのも狙いすぎで素敵だし、とにかく服飾の小道具が豪華でそこを見ているだけで楽しい。"6号"ネタやハリー・ポッターのエピソード、エイミーのダイエット話など、笑いどころの入れ方もうまい。アンドレアの役どころはかなりファンタジーが入っているけど(私もハイブランドの服や靴や鞄を着放題でスタイリストまでつくような職場で働いてみたい)、基本はエレン・ブロコビッチ的なアメリカン・ビジネス・シンデレラストーリーなので個人的にはそこは割り切ってもいい。
ただ終盤のパリでの展開、ミランダの仕事への情熱や人間的弱さを描いたその直後に「やっぱり冷酷でした」なんて落し方はないんじゃないだろうか。アンドレアの決断も、ファッション誌の仕事への敬意ごといきなり捨てるのは唐突かつ彼氏に都合が良すぎる。もう少し彼女の最後の決断への導線が素直にあってもいい気がする。
といった不満もあれど、ファッション好きなら絶対に見るべき。そこをおまけして5/5点。
Linux上で日本語ファイル名をローマ字に変換する
Posted by yoosee on Debian at 2008-02-12 20:00 JST1 日本語ファイル名をローマ字に変換する ruby + kakasi script
Palm TX で使っている pTunes が例によってSDカード上の日本語ファイルを扱ってくれない(id3tagは大丈夫だがファイルリストに表示されない)ので、ディレクトリ名・ファイル名をローマ字に変換するスクリプトを書いた。引数にディレクトリを指定すると recursive に日本語ファイル名をローマ字に変換する。処理には libkakasi を使用して、前段では -w での分かち処理もしている。また空白はアンダーラインに変換。割と破壊的なので利用には注意を。#!/usr/bin/ruby require 'kakasi' require 'find' require 'nkf' def romanize_dir dir Find.find(dir) do |fpath| next if NKF.guess(fpath) == 5 && !/\s+/ =~ fpath # ascii or whitespace begin filename = Kakasi.kakasi('-w', NKF.nkf('-e',fpath)).gsub(/\s*\/\s*/, '/') filename_roman = Kakasi.kakasi('-Ha -Ka -Ja -Ea -ka', filename) filename_roman.gsub!(/\s+/, '_').gsub!(/\^/,'-') rescue puts "failed to convert string #{fpath} - #{$!}:#{$@}" next end begin File.rename(fpath, filename_roman) puts fpath + " to " + filename_roman rescue puts "failed to convert filename #{fpath} - #{$!}:#{$@}" end if(File.directory? filename_roman) puts " + into directory #{filename_roman}" romanize_dir filename_roman end end end dir = ARGV.shift romanize_dir dirWindows だと同様の用途には Flexible Renamer や Ganmigi と言ったものがあるみたい。試してはいない。
February 18 Mon, 2008
英語版Palmの日本語化にYomeru5を試す
Posted by yoosee on Palm at 2008-02-18 22:00 JST1 Yomeru5
GPL で配布されている PalmOS 日本語化ソフト、Yomeru5 (5.0beta24) での Palm TX 日本語化を試した。Yomeru5 の ZIP に含まれる Yomeru-5.0-xxx.prc と日本語フォント、加えて YAHM.prc を HotSync でインストール。YAHM の設定画面で Yomeru5 を有効にし、インストールしたフォントを有効にする。日本語入力は POBox や ATOK など別途容易する必要があるが、その辺は私が普段使っている CJKOS も似たようなもの。
動作としては、さほど問題なく各アプリを日本語化してくれている。CJKOS に比べると動作が遅く感じることがあるが、フォントのアンチエイリアスを有効にしている影響かもしれない。また安定性は悪くないとは思うが、使用中に数度、原因不明のフリーズ/リセットを体験した。Yomeru5 の問題なのかは不明。
機能として面白いのは A.E.Change と言う日本語エンコーディングのトランスレーション機能があるところ。例えば標準の Web (Blazer) では日本語のページは文字コードによって読めないものがあるが、この機能を有効にすると概ね読めるようになる。ただ何故か VarsaMail ではSubjectは日本語表示出来るものの、本文表示では文字化けが直らなかった。
またフォントコンバータが含まれており、任意のフォントを変換して使うことが出来るようになっている。試しに変換したメイリオはアンチエイリアスを有効にしてもちょっと残念な見栄えになってしまったので、当該サイズの bitmap font が含まれるものを使った方がいいのかもしれない。細かいパラメータによる bitmap レベルのチューニングも出来るようだがそこまでは手を出せなかった。
OSSの日本語化ソフトがちゃんと動き、エンコーディングの変換やアンチエイリアスにも対応しているのは機能的にも優れた点だが、日本語を綺麗に表示するにはちょっとコツが要りそうな感じだろうか。
February 20 Wed, 2008
個人blogのRSSフィードは広告戦略として全文入りにする
Posted by yoosee on Web at 2008-02-20 23:00 JST1 SEO戦略として全文入りフィード配信を考える
original icon from schrank monster.個人ページでも「RSSフィードで全文配信するとページビューが増えず、広告収入も上がらない」論はあるらしいので、個人のblogで全文フィードを配信すべき理由を考えてみる。もちろん「全文フィード + フィード埋め込み広告」を入れるという手はある(企業サイト向けだがpheedoや、またAmazonのような固定リンク埋め込み型も有効)ので、可能ならばそれと併用するのがいいだろう。残念ながら現時点では Google Adsense のような JavaScript 型は非対応のものが多そうだが... と書きかけたが、いつの間にかFeedburnerがGoogle Adsenseに対応したりしているようだ。
個人のblogで広告収入を得ようとする場合、よほどの人気サイトでない限りは閲覧者の大半は検索からやってくる。また一般的に、日常的に見にきてくれている人の広告クリック率は非常に低いという話があり、実際に私の blog もトップページの広告クリック率はほぼ無きに等しい。
そうした事情を考えると、常連によるトップページへのアクセスに相当するRSS配信では、以下のようなパターンを狙うのが効率的じゃなかろうか。
- 全文入りRSSフィード配信で読者を増やす
- 読者の中にはBlogを書いたりsocial bookmarkしたりとリンクを張ってくれる人が一定数おり、そうした層とRSSリーダのユーザ層は比較的マッチングが高いと思われる
- 非リンク数が増えることにより直接的なアクセスが増加する
- ページランク向上により検索エンジンからのリーチが増加する
- 非常連のアクセスが増えることにより広告収入が増加する
- 増えたアクセスの一部はRSSフィードの読者になる(1に戻る)
そうであれば、個別記事URL(Permalink)の伝播層である可能性の高いRSSリーダ利用者の利便性を挙げる戦略は、最終的なPageview増加と言う意味でも、広告のクリック率向上という意味でも有利になるのではないか。
そうした戦略を取る場合、「RSS全文配信してないからもう読まない」と言うユーザが存在する以上、RSSは全文配信する方が最終的なリーチは増加すると考えることが出来るのではないだろうか。前述のフィード埋め込み型広告を併用すればフィード自体へのアクセスでも広告露出が可能なわけで、全文配信をためらう理由はあまりなさそうだ。
February 27 Wed, 2008
最近のspam送信者が進化している件について
Posted by yoosee on Debian at 2008-02-27 12:00 JST1 SMTPレベルでのspam送信機能改善
数年前から MTA レベルの spam フィルタ技術として tarpitting + greylist 等を適用しているが、最近どうも効きが悪い感じがしたので、すり抜けてくる spam について少し調査をしてみた。結論としては spam 送信ソフトの実装レベルがかなり上がってきた事が伺える。SMTP的な挙動が正常なMTAと区別が付かないspammerの増加
Greylist (わざと再送要求する) や Tarpit (応答コード送信を遅延させる) といった手法に普通の MTA と同じようにきちんと対応してくる spammer が増えてきている。元々 spam 送信者のソフトウェアが真面目に実装されていない事を利用した手法なので、真面目に実装した方が spam 送信率が高くなると認識された時点で対応されるのはある意味当然ではあるのだが、思ったより早く対応が進んでいる。その他でも、HELO/EHLO できちんと FQDN を送信してきたり、セカンダリMXを参照して再送をかけてきたりと、全般的にSMTP的な振る舞いは正しいMTAと区別できないレベルのものが確実に増えてきている。特に英語spamに顕著。
ISPの真っ当なメールサーバを中継してくるspammerの増加
正当なISPのメールサーバから正当なFromで送りつけてくる spammer が最近は多少目立つようになってきた。ほぼ同じ内容のspamが複数の送信者・ISP経由から来ているのを見るに、恐らくはウィルス感染PCのbotnetから広く浅く送ってきているのだろう。これをやられるともうSMTPレベルではフィルタのしようがなく、本文の文章解析に頼るしかない。2 From / To / Subject / Body の工夫
SMTPレベル以外でも、From / To や Subject, 本文自体にも色々と工夫が見られる。From が自分自身 (To と同一) であったりランダムであったりする
SpamAssassin では blacklist_from と言う From 固定フィルタがあるが、これが使えなくなる。From が自分自身と言うケースに付いては SPF のような送信サーバ認証を使う手はあり、SpamAssassin 等でも whitelist_from_spf と言った SPF 認証された From のみを Whitelist として扱う設定がある。個人的な問題は私の主メールアドレスのドメインを登録している NSI が未だに TXT レコードの編集に対応していないという所だが、SPF 対応サーバ自体は去年のドコモの PSF フィルタ開始から増加している。
Subject や本文にスペルミスを入れてくる
英語spamでの話になるが、固定文字列フィルタをすり抜けるためにわざとキーワードをスペルミスしてくる。よくあるのは Viagra を Viagara や Viarga と言ったようなもの。今のところはまだこうしたインテリジェントなspammerは大多数ではないため、既存の手法もそれなりの割合では効いているが、出来のいいツールが出回るようになると現行の手法では対処が難しくなるだろう。まめにメンテナンスされた DNSRBLs 、ドメイン認証、フロー制御、あとはコンテンツレベルでのより賢いフィルタリング等の重要性が増していくだろうが、より CPU リソースを消費する方向に進んでいると言うのはかなり憂鬱な話ではある。
どちらにせよ大量のサンプルと申告者を持っているサービスは有利になるので、個人レベルならば例えば「Gmailへフォワード→POP3で取得」などという方法を使うのも手かもしれない。