Mis on Bayesi teoreem?

Bayesi teoreem on retsept, mis kirjeldab, kuidas värskendada teooriate tõenäosust tõendite esitamisel. Põhimõtteliselt lähtub see tingimusliku tõenäosuse maksimumidest, kuid seda saab kasutada laias laastus küsimuste, sealhulgas süüdimõistvate otsuste värskenduste põhjendamiseks.

Arvestades teooriat H ja tõendit E, väljendab Bayesi teoreem, et spekulatsiooni tõenäosuse enne tõendi P (H) saamist tõenäosuse ja teooria tõenäosuse vahel pärast tõendi P (H∣E) saamist on seos

See on ilus tõenäosuse mõiste, kus tõenäosuse leiame siis, kui teame muud tõenäosust

Mis ütleb meile: kui regulaarselt A juhtub, kui B juhtub, koosneb P (A | B),

Kui me teame: kui regulaarselt B juhtub, arvestades, et An toimub, koosneb P (B | A)

peale selle, kui tõenäoline, et An on ilma kellegi teiseta, koosseisus P (A)

Veelgi enam, kui tõenäoline, et B on ilma kellegi teiseta, koosseisus P (B)

Näide Bayesi teoreemist

Te korraldate täna väljasõidu, aga hommik on pilves, jumal aitab meid! pool iga tormist päeva algab varjuliselt! Igal juhul on varjulised hommikud normaalsed (umbes 40% päevadest algab pilves) Lisaks on see tavaliselt kuiv kuu (30-st päevast vaid 3 on tavaliselt tormine ehk 10%). Milline on vihmasaju tõenäosus päevasel ajal? Kasutame vihma päevasel ajal vihmasaju ja pilves vihmase hommikuse ilmastiku ilmnemist. Pilve võimalus vihma korral koosneb P-st (vihm | pilv)

Seega peaksime selle paigutama võrrandisse:

  • P (vihma) tõenäosus, et sajab vihma = 10% (antud)
  • P (Pilv | Vihm) Tõenäosus, et pilved on kohal ja sajab vihma = 50%
  • P (pilv) on tõenäosus, et pilved on seal = 40%

Seega võime öelda, et punktis c:

See on Bayesi teoreem: et saate kasutada ühe asja tõenäosust, et ette näha millegi muu tõenäosust. Kuid Bayesi teoreem on kõike muud kui staatiline asi. See on masin, mida te mutrivõttega parandate ja ennustate uute tõenduspindadena paremini. Huvitav tegevus on tegurite fidgeerimine, eristades eristatavad teoreetilised omadused P (B) või P (A) ja nende sidususe mõju P (A | B) -le. Näiteks kui suurendate nimetajat paremal, siis P (A | B) langeb. Kindel mudel: nohu on märk leetritest, kuid nohu on vaieldamatult tüüpilisem kui väikeste valgete laikudega nahalööbed. See tähendab, et kui valite P (B), kus B on nohu, lükkab nohu kordumine kogu avalikkuse ette võimaluse, et nohu on leetrite näitaja. Leetrite leidmise tõenäosus väheneb järk-järgult normaalseks muutuvate kõrvaltoimete osas; need ilmingud ei ole kindlad vihjed. Sarnaselt, kui leetrid muutuvad üha normaalsemaks ja P (A) tõuseb parempoolses lugejas, tõuseb P (A | B) põhiliselt põhjusel, et leetrid on tavaliselt tõenäolisemad, pöörates vähe tähelepanu kõrvaltoimele, mis arvate.

Bayes teoreemi kasutamine masinõppes

Naiivne Bayes klassifikaator

Naive Bayes on iseloomustusarvutus topelt (kahes klassis) ja mitmeklassilises rühmitamises. Süsteem on kõige vähem kohustatud mõistma, kui seda kujutatakse kasutades topelt- või sirgjoonelisi infoomadusi.

Seda nimetatakse naiivseks Bayesiks või imbetsilseks Bayesiks, arvestades asjaolu, et iga teooria tõenäosuste kujutamine on sujuvamaks muudetud, et muuta nende arv jälgitavaks. Vastupidiselt püüdlusele välja selgitada iga tunnuse hinnangu P (d1, d2, d3 | h) hinnangud, peetakse neid objektiivse väärtuse korral piiravalt vabadeks ja määratakse P (d1 | h) * P (d2 | H, jne.

See on kindel oletus, mis on ehtsas teabes kõige kaugemal, näiteks et atribuudid ei suhtle. Vahetult toimib metodoloogia šokeerivalt selle teabe osas, kus see eeldus ei kehti.

Kujutis, mida kasutavad Naive Bayes mudelid

Naiivse Bayesi algoritmi kujutamine on tõenäosus.

Tõenäosustega seotud komplektid jäetakse petitsiooniks teaduslikult naiivse Bayesia mudeli saamiseks. See hõlmab järgmist:

Klassi tõenäosus: tõenäosus kõige jaoks, mis on ettevalmistamise andmestikus.

Tingimuslik tõenäosus: tingimusliku tõenäosuse olemasolu iga esinemisinfo kohta, mis on väärt, arvestades iga klassi tunnustust.

Võtke andmete põhjal kasutusele naiivne Bayes'i mudel. Naiivse Bayesia mudeli valimine ettevalmistamise infost on kiire. Ettevalmistus on kiire, arvestades asjaolu, et klassi iga eksemplari tõenäosusväärtused ja klassi iga eksemplari tõenäosusväärtused, mille jaoks on eristatavad teabe (x) väärtused, tuleks kindlaks määrata üksikult. Parandussüsteemid ei tohiks koefitsientidele sobida.

Klassi tõenäosuste arvutamine

Klassi tõenäosus on põhimõtteliselt selliste juhtumite kordumine, millel on koht iga klassiga eraldatud juhtude koguarvust.

Näiteks paralleelklassis määratakse juhtumil tõenäosus saada koht klassiga 1 järgmiselt:

Tõenäosus (klass = 1) = kokku (klass = 1) / (kokku (klass = 0) + kokku (klass = 1))

Kõige sirgjoonelisemal juhul on igal klassil kahekordse klassifitseerimise korral tõenäosus 0, 5 või pool, kusjuures klasside igas astmes on sama arv juhtumeid.

Tingimusliku tõenäosuse arvutamine

Tingimuslikud tõenäosused on iga tunnuse hinnangu kordumine antud klassis, seda väärt jagatuna selle klassi hinnanguga näidete kordumisega.

Kõik Bayesi teoreemi rakendused

Bayesi teoreemi on reaalsuses palju kasutatud. Püüdke mitte rõhutada võimalust, et te ei näe kohe kõiki aritmeetikat. Alustuseks on lihtsalt tunne, kuidas see töötab.

Bayes'i otsusteooria on mõõdetav viis näite klassifitseerimise küsimusega tegelemiseks. Selle hüpoteesi kohaselt eeldatakse, et klasside põhiline tõenäosuse ülekandmine on teada. Sel viisil omandame täiusliku Bayesi klassifikaatori, mille alusel tehakse igale teisele klassifikaatorile täitmise otsus.

Räägime Bayesi teoreemi kolmest põhikasutusest:

  • Naiivse Bayesi klassifikaator
  • Diskrimineerivad funktsioonid ja otsustuspinnad
  • Bayesi parameetri hinnang

Järeldus

Bayesi teoreemi suurejoonelisus ja intensiivsus ei häiri mind kunagi. Põhiidee, mille esitas üle 250 aasta tagasi preester, on selle kasutamine tänapäeval absoluutselt kõige eksitamatumates AI protseduurides.

Soovitatavad artiklid

See on Bayesi teoreemi juhend. Siin käsitleme Bayesi teoreemi kasutamist masinõppes ja Naiivsete Bayesi mudelite kasutatud kujutamist näidetega. Võite lisateabe saamiseks vaadata ka järgmisi artikleid -

  1. Naiivse Bayes'i algoritm
  2. Masinõppe algoritmide tüübid
  3. Masinõppe mudelid
  4. Masinõppe meetodid

Kategooria: