Sissejuhatus AdaBoosti algoritmi

AdaBoosti algoritmi saab kasutada mis tahes masinõppe algoritmi jõudluse suurendamiseks. Masinõppest on saanud võimas tööriist, mis suudab ennustada suure hulga andmete põhjal. Viimasel ajal on see muutunud nii populaarseks, et masinõppe rakendusi võib leida meie igapäevastest tegevustest. Selle levinum näide on veebis ostmise ajal toodete kohta soovituste saamine, mis põhineb kliendi varasemal ostetud kaupadel. Masinõpet, mida sageli nimetatakse ennustavaks analüüsiks või ennustavaks modelleerimiseks, võib määratleda kui arvuti võimet õppida ilma seda selgesõnaliselt programmeerimata. See kasutab sisendandmete analüüsimiseks programmeeritud algoritme, et prognoosida väljundit vastuvõetavas vahemikus.

Mis on AdaBoosti algoritm?

Masinõppes lähtus tõstmine küsimusest, kas nõrkade klassifikaatorite komplekti saaks muuta tugevaks klassifikaatoriks. Nõrk õppija või klassifikaator on õppija, mis on parem kui juhuslik arvamine ja see sobib üleliigseks sobimisel nagu suures osas nõrkade klassifikaatoritega, kusjuures iga nõrk klassifikaator on parem kui juhuslik. Nõrga klassifikaatorina kasutatakse tavaliselt ühe funktsiooni lihtsat läve. Kui funktsioon on ennustatud künnisest kõrgem, kuulub see positiivsesse, vastasel juhul kuulub negatiivsesse.

AdaBoost tähistab kohanemisvõimendust, mis muudab nõrgad õppijad või ennustajad tugevateks ennustajateks, et lahendada klassifitseerimise probleemid.

Klassifitseerimiseks võib lõpliku võrrandi esitada järgmiselt:

Siin tähistab f m m nõrka klassifikaatorit ja m tähistab selle vastavat kaalu.

Kuidas AdaBoosti algoritm töötab?

AdaBoosti saab kasutada masinõppe algoritmide jõudluse parandamiseks. Seda kasutatakse kõige paremini nõrkade õppuritega ja need mudelid saavutavad klassifikatsiooniprobleemil suure täpsuse kui juhuslik juhus. AdaBoostiga kasutatavad tavalised algoritmid on esimese astme otsustuspuud. Nõrk õppur on klassifikaator või ennustaja, kelle täpsus on suhteliselt nõrk. Samuti võib järeldada, et nõrkadel õppijatel on lihtne arvutada ja paljud algoritmid on ühendatud tugevdamise kaudu tugeva klassifikaatori loomiseks.

Kui võtame n-punkti punkte sisaldava andmekogumi ja arvestame allpool toodud asjaoludega

-1 tähistab negatiivset klassi ja 1 tähistab positiivset. See lähtestatakse järgmiselt, iga andmepunkti kaal on järgmine:

Kui arvestame m iteratsiooni 1-st M-ni, saame järgmise avalduse:

Esiteks peame valima madalaima kaalutud klassifikatsioonivigaga nõrga klassifikaatori, kohandades nõrgad klassifikaatorid andmekogumisse.

Seejärel arvutatakse m nõrga klassifikaatori kaal järgmiselt:

Kaal on positiivne iga klassifikaatori puhul, mille täpsus on suurem kui 50%. Kaal muutub suuremaks, kui klassifikaator on täpsem, ja see muutub negatiivseks, kui klassifikaatori täpsus on alla 50%. Ennustust saab kombineerida märgi ümberpööramisega. Ennustuse märgi ümberpööramisel saab 40% täpsusega klassifikaatori teisendada 60% täpsusega. Seega aitab klassifikaator kaasa lõpliku ennustamise, isegi kui see töötab halvemini kui juhuslik arvamine. Lõplik ennustus ei anna aga mingit panust ega saa klassifitseerijalt teavet täpselt 50% täpsusega. Eksponentsiaalmõõtur lugejas on alati suurem kui 1 positiivse kaalutud klassifikaatori valesti klassifitseeritud juhtumi korral. Pärast iteratsiooni värskendatakse valesti klassifitseeritud juhtumeid suuremate kaaludega. Negatiivselt kaalutud klassifikaatorid käituvad samamoodi. Kuid on erinevus, et pärast märgi ümberpööramist; algselt muutuks õige klassifikatsioon vääraks klassifitseerimiseks. Lõpliku ennustuse saab arvutada, võttes arvesse iga klassifikaatorit ja viies seejärel läbi nende kaalutud ennustuse summa.

Iga andmepunkti kaalu värskendamine järgmiselt:

Z m on siin normaliseerimistegur. See tagab, et kõigi esinemisjuhtude summa kokku võrdub 1-ga.

Milleks AdaBoosti algoritmi kasutatakse?

AdaBoosti saab kasutada näotuvastuseks, kuna see näib olevat piltide näotuvastuse standardne algoritm. See kasutab hülgamiskaskaadi, mis koosneb paljudest klassifikaatorite kihtidest. Kui tuvastusakent ei tuvastata üheski kihis näona, lükatakse see tagasi. Esimene klassifikaator aknas loobub negatiivsest aknast, hoides arvutuskulud minimaalsed. Kuigi AdaBoost ühendab nõrgad klassifikaatorid, kasutatakse AdaBoosti põhimõtteid ka parimate omaduste leidmiseks kaskaadi igas kihis.

AdaBoosti algoritmi plussid ja miinused

Üks AdaBoosti algoritmi paljudest eelistest on see, et seda on kiire, lihtne ja hõlpsalt programmeeritav. Samuti on sellel paindlikkus, mida saab kombineerida mis tahes masinõppe algoritmiga, ja pole vaja parameetreid häälestada, välja arvatud T. See on laiendatud ka binaarsest klassifikatsioonist väljaspool olevatele õppimisprobleemidele ja on mitmekülgne, kuna seda saab kasutada teksti või numbrilise numbriga andmed.

AdaBoostil on ka vähe puudusi, näiteks empiiriliste tõendite põhjal ja eriti ühtlase müra suhtes. Liiga nõrgad nõrgad klassifikaatorid võivad põhjustada madalaid marginaale ja ületäitumist.

AdaBoosti algoritmi näide

Võime käsitleda näidet üliõpilaste vastuvõtmisest ülikooli, kuhu nad kas võetakse vastu või keeldutakse. Siin võib kvantitatiivseid ja kvalitatiivseid andmeid leida erinevatest aspektidest. Näiteks võib vastuvõtu tulemus, mis võib olla jah / ei, olla kvantitatiivne, samas kui mis tahes muu valdkond, näiteks õpilaste oskused või hobid, võib olla kvalitatiivne. Me võime hõlpsalt välja mõelda koolitusandmete korrektse klassifitseerimise, parem kui võimalus tingimustel, näiteks kui õpilane oskab konkreetses aines hästi, siis ta võetakse vastu. Kuid väga täpset ennustust on keeruline leida ja siis satuvad pildile nõrgad õppijad.

Järeldus

AdaBoost aitab valida iga uue klassifikaatori jaoks treeningkomplekti, mida treenitakse eelmise klassifikaatori tulemuste põhjal. Ka tulemusi kombineerides; see määrab, kui palju kaalu tuleks iga klassifikaatori pakutud vastusele anda. See ühendab nõrgad õppijad tugeva klassifikatsioonivigade parandamiseks. See on ka esimene edukas algoritm binaarse klassifitseerimise probleemide parandamiseks.

Soovitatavad artiklid

See on olnud AdaBoosti algoritmi juhend. Siin arutasime näite abil kontseptsiooni, kasutusviise, töötamist, plusse ja miinuseid. Lisateavet leiate ka meie muudest soovitatud artiklitest -

  1. Naiivse Bayes'i algoritm
  2. Sotsiaalmeedia turunduse intervjuu küsimused
  3. Lingi loomise strateegiad
  4. Sotsiaalse meedia turundusplatvorm

Kategooria: