[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Bayes Spam Schwellen u.ä.



HI,

ich experimentiere gerade mit den Bayes-Einstellungen

a) Manche Virenmails enthalten extrem wenig Text und viel MIMEkram,
deshalb hab ich mal dei wortzwhal wieder auf die Standard 10
runtergesetzt von 20 (10 waren zu wenig, wenn man den Header
mitanalysoert hat, was ich jetzt wieder lasse). Die ultrakurzen
Virenmails gegen idR wohl nicht genug Keywords her.

b) ich alsse spam nicht emhr ab 90 sondern schon ab 80 markieren und
habe entsprechende Sortierfolder eingerichtet um das zu sichten.
Bisher keine false positives.

c) Ich hab jetzt 2 experimentelle Folder eingerichtet. in dei ich
Bayes-Zahlen von 60-70 und 70-80 einsortieren lasse (sofern kein
anderer Teil von Spampal sie als Spam erkennt, d.h. clean via regex
und countries, relays und whatever), hisher  keine false positives.

d) Mein Eindruck ist, dass die Spammer immer mehr versuchen Mails zu
produzieren, die wie 'normale' Mails aussehen. D.h. es bleibt fast nur
die URL (oder der Header?) als 'Bayesmaterial'. was bedeutet das
längerfristig für Bayesfilter?

(Es war ja illusorisch zu denken, die Spammer würden auf Bayesmethoden
nicht regaieren... Theoretisch könnte man ja an jede Spammail 100
Zeilen 'positive' Bayeswörter anhängen...)




-- 
oliver gassner - radbrunnengasse 1/2 - D-71665 vaihingen an der enz
og@carpe.com - mobil 0179 297 234 2 -  http://www.oliver-gassner.de/
literatur:  http://www.carpe.com/
lektorat: http://www.literaturbuero.de/lektorat/indexLektorat.htm

-- 
To unsubscribe, e-mail: debate-unsubscribe@lists.fitug.de
For additional commands, e-mail: debate-help@lists.fitug.de