Comme vous le savez peut-être, je suis aussi l’auteur d’un site de lutte contre le SPAM (SpamAnti.net). Sur ce site, je conseille régulièrement l’usage d’un outil de filtrage statistique du courrier électronique pour se débarasser du SPAM : K9 de Robin Keir.
Mais beaucoup d’entre nous qui ont essayé des outils parfois vendus très cher savent que l’efficacité est souvent faible sinon pitoyable. Alors, comment se débrouille K9 ? Très bien.
Comment ça marche ?
Tout d’abord, il faut comprendre comment fonctionne un tel outil. Il s’installe entre le serveur de mail de votre Fournisseur d’Accès Internet (FAI) et votre lecteur de courrier électronique. Il tourne sur le PC, demande à reconfigurer légèrement le logiciel de mail, puis fonctionne tranquillement dans votre dos.
Ou à peu près, puisque pendant les premiers jours, il faut lui montrer quels sont les bons et les mauvais mails (il a une petite idée, mais elle est très approximative). Ensuite, il va en tirer de lui-même des critères statistiques de tri.
Efficacité
Pour parler précisément, K9 inclut directement des statistiques qui permettent de savoir à quel niveau d’efficacité il se trouve. On a donc toute l’information nécessaire.
Ensuite, il y a deux mesures qui sont importantes à relever :
- l’efficacité en fonctionnement continu
- l’efficacité (normalement réduite) pendant la phase initiale d’apprentissage
Pour le fonctionnement en continu je n’ai que des éloges : après des mois de messagerie (soit plus de 100,000 mails) le score est éloquent : 99.95% au minimum alors que je reçois des SPAMs d’absolument toutes les origines.
La question restait ouverte pour la phase d’apprentissage. Hors, je viens de refaire l’installation email de mon PC ; j’ai donc pu observer et mesurer cette nouvelle phase d’apprentissage. Et la bonne nouvelle arrive là aussi : sur 2994 mails (en une journée), j’ai dû reclasser 9 messages comme « bon », et 5 messages comme « mauvais ». Cela donne un 99,53% d’efficacité et l’apprentissage est visiblement fini depuis au moins 1500 messages.
Bien entendu, je en conseille pas de fermer les yeux à partir de là. Mais K9 procure un moyen simple et rapide de revenir en arrière pour chercher les erreurs toujours possibles : il classe les messages selon leur probabilité d’être du SPAM. 0% c’est du tout bon, 100% c’est du SPAM. Quand on regarde quels sont les messages à proximité de la limite (50%), on repère facilement les quelques messages mal aiguillés.
Dans le cas ci-dessus, K9 montre clairement le message licite reçu (en bleu, avec une probabilité de 2,5%) et les SPAM (en noir, avec des pourcentages largement supérieurs à 50%).
Note francophone
Détail pas négligeable pour nous autres francophones : même si le site web de Robin Keir est en anglais, et même si j’utilise moi-même la version anglophone du produit, il existe sur le site une extension téléchargeable qui permet de le faire passer en français pour un meilleur confort.
Et c’est tout gratuit !
Laisser un commentaire