2010/6/20(Sun) 20:46

掲示板スパム対策

テーマ: 開発日誌 雑記 

最近、掲示板のスパム投稿が激しくなってきたので、対策を練ってましたが、
何とかスパムだけはじけるようになったので、レポート。


最終的には、ベイジアンスパムフィルタと言うものを導入しました。
本文に含まれる単語から、スパムの確率を計算する方式です。
メールで使わる方法ですが、上手く調整することで、掲示板にも有効でした。
評価結果はこんなで。


[評価結果]
http://summer.kokage.cc/pulltop/junk/g0620_result.txt


[スパム辞書]
http://summer.kokage.cc/pulltop/junk/g0620_dict.txt


まあ、見てもあんまり面白くないかもですが、ここ数日の死闘の結果。




記事URL  コメント(2)  ペタ   
コメント(2)
1.  たけふる     
スパム辞書のデータを拝見して、サイト管理の方々の苦労が偲ばれました。
そういえば、昔はこの手のスパムメールが大量に届いてたなぁ。と。
フィルターが対応するようになってからほとんど見ることなくなりましたが。
メールも掲示板も、こんな風に対策されていたんですね。
 
すみすみな話題なんかだとひっかかる可能性があるかもなぁ。(苦笑                                                             [2010/06/21 02:03]

2.  ハル@管理人     [HP]
> すみすみな話題
普通の長さの文であれば、多分大丈夫と思いますが、
短文だとひっかかる可能性は、あるかな。
                    [あやしさ] [判定]
尻穴すみかの誕生日  0.438790   clean (ぎりぎりセーフ)
尻穴ード・レイ!    0.598742   spam! (アウト!)
十歳からの性教育    0.908690   spam! (アウト!)
 
単に退避してるだけなので、一瞬で復活できるようにはなってます。
 
 
…とか言ってたら、お尻ネタで突破されてたよ 0.361928                                                             [2010/06/21 23:28]


お名前  非公開
コメント
email URL
   

記事: 335/467
記事: 335/467