スパムの缶詰

2004.11.15.Mon

[ スパムメールのリスト / 78KB ]

 約20日間ためこんだスパムのリスト。191通中、178通がスパムという惨状。
 どうもZEROのメールアドレスが悪質なとこに渡ってしまったようで、毎日たくさんのスパムをいただくようになってしまった。このアドレスはネットデビューの頃から使っていて、ユーザー登録とか会社系の捨てアドレスとして未だに現役である。(プライベートは自分ドメインのメールアドレスへ移行済)

 そんなわけで、POPFileを導入した。アドレス消せない受信しなきゃいけない、でもスパムは容赦なく押し寄せる…となれば、スパムフィルタの類いを入れるしかない。
 POPFileは学習型のスパムフィルタで、プロキシとして動作する。つまりメールソフトはPOPFileを通して受信する。POPFileはメールソフトに代わってメールを受信し、スパムと判断したら題名に [spam] を追加してメールソフトへ渡す。あとはメールソフト側のフィルタで「題名に [spam] が入ってるメールは削除する」と設定しておけばいい。(追加される文字列は設定可能で、題名以外にヘッダへの追加もできる)

 POPFileは学習型なので、最初のうちは使いものにならない。間違ってたら振り分け履歴を開いて「これはスパム、これは違う」と教えていかないといけない。その辺はちょっと面倒くさいが、200通くらいの経験を積めば、先の画像のようにかなりの高確率で振り分けてくれる。

■ベイズ推定
トーマス・ベイズさんが考えた「過去の統計から将来を予測する」という理論で、POPFileに使われているアルゴリズム。メールを単語に分解し、含まれている単語の統計を取って未知のスパムを識別する。
Googleの検索エンジンも使ってたりビル・ゲイツさん自ら「21世紀のマイクロソフトの戦力はベイズ・テクノロジーである」と言っちゃうほどすごいものらしい。

[ POPFileのインターフェイス / 27KB ] POPFileは専用のインターフェイスを持たない。プロキシサーバーとして動作し、ブラウザからすべての管理を行う。
最初はとまどうが、設定項目も少なく、特に扱いにくいということはない。

[ スキンを変更したところ / 33KB ] UIにブラウザを使ってるということで、CSSを使ったスキン変更機能もある。

 ステルスモードをオフにすると、LAN上の他のPCからPOPFileにアクセスできる。(WANからもアクセスできてしまうのでセキュリティ管理はしっかりと)

 POPFileのインストールは簡単。セットアップを実行して、あとはナビゲーションの指示に従えば勝手に入る。メールソフトの設定も変更しないといけないが、Outlook ExpressとかEudoraとかメジャーなやつなら自動でやってくれるし、アンインストールすると元に戻してくれる。

[ nPOPのアカウント設定画面 / 3KB ]
nPOP(Q)など、オンラインソフトレベルのメーラーを使ってる時は自分で設定しないといけない。
POP3サーバのアドレスにはPOPFileを入れたPCのネットワーク名を入れる。自分自身なら localhost と入れる。
ユーザアカウント名には、POP3サーバアドレス:ユーザーアカウント名 のように半角のコロンで区切って入れる。
これだけでOK。

 今はまだ入れたててで精度もすこぶる悪いが、使えば使うほど賢くなって最終的には99%以上にも達するというから、気長に育てていくとしよう。
 ちなみに、「これだけは間違えられると困る」というアドレスはマグネットに登録しておくと振り分けミスを防げる。

追記:2005.1.23
2ヵ月ばかり使いましたが、振り分け精度はほぼ100%です。すごいです。面白いように分別してくれます。

POPFileはPerl製で大部分はテキスト形式のスクリプトであり、つまりソースを見られるわけだが、俺程度の素人Perlerに理解できる代物ではなかった。



Page Index
日付 題名 記事の要約
2004.11.5 RAIDが危険(正常) -80GB
2004.11.6 寺目前 +200GB
2004.11.7 奇跡の化け物 現実に動く5インチHD
2004.11.11 突くピン挟むピン 小物工具
2004.11.12 バックアップ高速化作戦 ファイル数ダイエット
2004.11.13 Multi Opener Nepo 1.01 秀丸マクロバージョンアップ
2004.11.15 スパムの缶詰 POPFile導入記
2004.11.16 斜めに貼りつけて 大量貼付の罠
2004.11.19 Multi Opener Nepo 1.02 秀丸マクロバージョンアップ
2004.11.22 紗菜☆557時間 連続起動記録挑戦記
2004.11.23 Multi Opener Nepo 1.03 秀丸マクロバージョンアップ