ネットニュースから spam 記事を取り除く
- 変更点
- 10/17:
- W32.Swen.A@mm ワームのチェックを追加しました。
SpamCheck コマンド群はニューススプールのディレクトリから spam 記事を取り除
くものです。
INN-2.0 以降で導入された、新しい保存形式には対応していません。従来
どうり(traditinal)の個別ファイルで保存する方法のみ対応しています。
spam かどうかのチェックは主に日本語でないということで、チェックして
います。従って spam 記事でない英語の記事も spam と判定されます。
従って、本コマンドは主に fj ニュースグループで使われることを前提と
しています。
fj.life.in-japan のように英語が主に使われているアーティクルの spam
チェックを行わないように指定することもできます。
チェック法は次の通りです。
1) 全て 7 ビットの記事(ただし 8 ビットが 4 文字以上続かない記事も
含める)。
2) ^[(ESC) 文字がない。
3) From: の中に .jp がない。
4) NNTP-Posting-Host: の中に .jp がない。
上記の条件が同時に成立した記事を spam と判定しています。
その他、指定された From: のアドレス、指定された Message-ID: の ID、
指定された NNTP-Posting-Host: のアドレスと(一部分でも)一致した場
合は spam 記事とすることもできます。
SpamCheck に W32.Swen.A@mm ワームのチェックを追加しました。
判断方法はファイルサイズが 140000 バイト以上で、本体に
/"October 2003, Cumulative Patch" update/ か
/"September 2003, Cumulative Patch" update/ か
/"September 2001, Cumulative Patch" update/ が含まれいることです。
条件に一致すれば、日本語シーケンスが含まれている、いないに関わらず
全て spam として処理されます。
W32.Swen.A@mm ワームについては次の URL を参照してください。
http://securityresponse.symantec.com/region/jp/sarcj/data/w/w32.swen.a@mm.html
SpamCheck コマンド群は perl 言語で作成されています。
使用方法は
SpamCheck.1.1.031016.tar.gz をダウンロードした後、
ファイルを展開してその中の README.txt
ファイルをお読みください。