namics Weblog
namics Weblog.
Persönliche Stimmen und Meinungen von Mitarbeiterinnen und Mitarbeitern.
namics @ www.flickr.com

Links

  • Sharepoint Weblog
  • about:namics
  • namics Website

AKTUELLE ARTIKEL

  • Firmenpolitik oder Sabotage
  • Erfolgsfaktoren für Intranet-Wikis in Unternehmen (Vortrag)
  • Zwei Fragen zu Online Kommunikation
  • Ich kann nicht mehr alles lesen, aber cool sieht es aus
  • Vortrag: Das Wiki wird erwachsen
  • Bei mehr als 1GB/Sekunde vorher melden: Die Wolkenfront ist da
  • Bildersuche nach Farbe (auf Basis von Flickr)
  • Vortrag auf dem ECM World Summit
  • Gleichberechtigte Sichten im Intranet
  • Pragmatisches User Centered Design bei bahn.de

Kategorien

  • Accessibility
  • Blogging
  • Business
  • CEO-Post
  • Collaboration
  • Design
  • Fehlermeldungen
  • Gesellschaft
  • Information Retrieval
  • Lotusphere
  • Mobile
  • Online Marketing
  • Orbit-iEX
  • Project Management
  • SEO+SEM
  • Technologie
  • Vorträge
  • Web Analytics

Archive

  • November 2008
  • Oktober 2008
  • September 2008
  • August 2008
  • Juli 2008
  • Juni 2008
  • Mai 2008
  • April 2008
  • März 2008
  • Februar 2008
  • Januar 2008
  • Dezember 2007
  • November 2007
  • Oktober 2007
  • September 2007
  • August 2007
  • Juli 2007
  • Juni 2007
  • Mai 2007
  • April 2007
  • März 2007
  • Februar 2007
  • Januar 2007
  • Dezember 2006
  • November 2006
  • Oktober 2006
  • September 2006
  • August 2006
  • Juli 2006
  • Juni 2006
  • Mai 2006
  • April 2006
  • März 2006
  • Februar 2006
  • Januar 2006
  • Dezember 2005
  • November 2005
  • Oktober 2005
  • September 2005
  • August 2005
  • Juli 2005
  • Juni 2005
  • Mai 2005
  • April 2005
  • März 2005
  • Februar 2005
  • Januar 2005
  • September 2004
  • August 2004
  • Juli 2004
  • Juni 2004
  • Mai 2004
  • April 2004
  • Februar 2004
  • Februar 2003

XML und Mumbo Jumbo

  • namics ag
  • namics ag
  • namics ag
  • Atom Feed
  • RSS 2.0 Feed
  • Creative Commons License
    Dieses Weblog untersteht der Creative Commons Lizenz
  • Powered by Movable Type 3.35
« Business Intelligence à la Oracle | Übersicht | Spam until proven otherwise - Day 1 »
01
Feb
Spam until proven otherwise
gepostet von am 01.02.2007 um 15:55

One of the reasons I started using Thunderbird was its (at the time) excellent Spam filters. After a few clicks, it identified 80 or 90% of the incoming Spam and filed it away.

Unfortunately, the spammers fight back. I was reminded of this last night when I checked my private email for the first time in 36 hours - 187 messages of which exactly 13 were messages that I might actually want to read.

Roughly half of the rest were identified by either Thunderbird or SpamAssassin as Spam. But the rest — some 80 messages — were advertisements for penny stocks disguised as fudge brownie recipes; neither tool recognized them as Spam.

Maybe this is the wrong approach. If 90% of all email is spam, then maybe we should just assume all email is spam, unless proven otherwise. Maybe it is easier to identify real mail than spam.

I am going to try a little experiment. I am going to reset the training data of Thunderbird's junk mail controls and reverse the usage. I'm going to call real mail spam. So the "Junk" folder becomes the receptacle for potentially interesting email. Seems perverse, but real mail isn't trying to cloak its identity.

Has anyone tried this approach? Anyone want to try it with me and compare results....?



TRACKBACK

TrackBack URL for this entry:
http://blog.namics.com/mt/mt-tb.cgi/768

KOMMENTARE

Sehr interessante Idee! Bin äusserst gespannt auf das Resultat.

gepostet von Michi am 01.02.07 19:17

doof an der sache ist, dass man das problem anscheinend nicht an der wurzel packen kann.

fast der gesamte mail-verkehr im netz ist mittlerweile spam, aber solange der anteil von mail am gesamtverkehr nur 10 bis 15% beträgt, scheinen die provider kein wirksames mittel finden zu wollen.

gepostet von Markus Koller am 02.02.07 09:18

I don't think Bayes cares what you label its categories.

gepostet von hannes am 02.02.07 09:57

hannes,

This is probably true, but there is a difference. Which messages do I gives to the Bayes filter, the good ones or the bad ones? At the moment I'm giving all the bad ones that it doesn't catch automatically. This doesn't seem to be helping.

The characteristics of the good messages don't change much over time. The bad ones are constantly changing to fool the filters.

gepostet von Peter Stevens am 02.02.07 12:45

Markus,

Ich glaube, dass ist nicht so einfach, wie es tönt.

Vielleicht könnte man port 25 (SMTP) gründsätzlich blockieren, alle E-Mails wäre dann über Servern des jeweiligen Providern kanalisiert.

Bei meiner Schwiergermutter macht T-Online genau das. Die Rucksender-Addresse wird auf die des Abonennten-Halters umgeschrieben. Das war zwar sehr mühsam, aber vielleicht ist es ein Anti-Spam-Massnahme - eine Lösung mit Vor- und Nachteile.

gepostet von Peter Stevens am 02.02.07 12:59

KOMMENTAR SCHREIBEN

Name:

E-Mail Adresse:

URL:

Bitte das Ergebnis von 1 + 2 als Ziffer (Spamschutz):