Teorema lui Bayes

De la Wikipedia, enciclopedia liberă
Salt la: Navigare, căutare

Teorema lui Bayes este una din teoremele fundamentale ale teoriei probabilităților, care determină probabilitatea apartenenței evenimentelor și a obiectelor la o anumită grupă. A fost enunțată de matematicianul britanic Thomas Bayes.

În cazul filtrelor spam bazate pe teorema lui Bayes (numite și filtre bayesiene), pentru determinarea probabilității apartenenței unui anumit mesaj la spam, sînt utilizate dicționarele create în timpul „învățării” filtrului. De regulă programul „învață” analizând arhivele de e-mail-uri, selectate în prealabil manual. Când dicționarele sînt create definitiv, probabilitatea apartenenței unui nou mesaj la spam este calculată prin normalizarea și sumarea probabilității fiecărui cuvânt în parte. Prin urmare, adunând informații statistice despre rata de apariție a unor diferite cuvinte și structuri în mesajele de tip spam sau în mesajele legitime, filtrul compară apoi noile mesaje cu aceste modele și le clasifică corespunzător.

Filtrele bayesiene oferă o precizie de filtrare de 97%-99%, iar fiind corect „antrenat” poate atinge și 100%.

Legături externe [modificare]

  • SpamAssassin - filtru anti-spam cu funcții de filtrare bayesiană
  • SpamBully - filtru anti-spam Bayesian pentru Outlook și Outlook Express