Sissejuhatus kernelmeetoditesse masinõppes

Mustrianalüüsis kasutatavat algoritmi nimetatakse masinõppes Kerneli meetodiks. Üldiselt analüüsitakse andmekogudes seoste leidmiseks. Need seosed võivad olla klasterdamine, klassifitseerimine, põhikomponendid, korrelatsioon jne. Enamik neist algoritmidest, mis lahendavad need mustri analüüsimise ülesanded, vajavad töötlemata esinduse andmeid, et need oleks sõnaselgelt muudetud tunnusvektori esitusviisiks. Seda ümberkujundamist saab teha kasutaja määratud funktsioonide kaardi abil. Seega võib eeldada, et kerneli meetod nõuab ainult kasutaja määratud kerneli.

Kernali meetodi terminoloogia tuleneb asjaolust, et nad kasutavad kerneli funktsiooni, mis võimaldab neil toimingu teostada kõrgmõõtmelises, kaudses tunnusruumis, ilma et oleks vaja arvutada selles ruumis asuvate andmete koordinaate. Selle asemel arvutavad nad sisemise toote kõigi andmepaaride kujutiste vahel funktsiooniruumis.

Sellised toimingud on arvutuslikult odavamad enamasti kui koordinaatide selgesõnaline arvutamine. Seda tehnikat nimetatakse tuuma trikkiks. Mis tahes lineaarset mudelit saab mittelineaarseks mudeliks muuta, rakendades mudelile tuumatrikki.

Masinõppes saadaval olev tuumameetod on põhikomponentide analüüs (PCA), spektraalklasterdamine, tugivektorimasinad (SVM), kanooniline korrelatsioonianalüüs, tuuma perceptroon, Gaussi protsessid, katuseharja regressioon, lineaarsed adaptiivsed filtrid ja paljud teised. Mõistame mõnda neist kerneli meetoditest kõrgel tasemel.

7 parimat tuumameetodit masinõppes

Siin on allpool mainitud tuuma meetodid masinõppes:

1. Põhikomponentide analüüs

Põhikomponentide analüüs (PCA) on tehnika, mille abil eraldatakse võimalikest kõrgmõõtmelistest andmekogumitest struktuur. Seda saab hõlpsalt teostada, kasutades iteratiivseid algoritme, mis hindavad põhikomponente, või lahendades omaväärtuse probleemi. PCA on koordinaatsüsteemi ortogonaalne teisend, milles kirjeldame oma andmeid. Uus koordinaatsüsteem saadakse projekteerimisel andmete põhitelgedele. Väikesest arvust põhikomponentidest piisab sageli suurema osa andmestruktuuri moodustamiseks. Selle üks peamisi rakendusi on uurimusliku andmeanalüüsi tegemine ennustava mudeli valmistamiseks. Enamasti kasutati seda populatsioonide ja geneetilise kauguse seose visualiseerimiseks.

2. Toeta vektormasinat

SVMi võib määratleda klassifikaatorina hüpertasandi eraldamiseks, kus hüpertasapind on ühe mõõtme alamruum väiksem kui ümbritsev ruum. Selle matemaatilise ruumi mõõt on defineeritud kui minimaalne koordinaatide arv, mis on vajalik mis tahes punkti täpsustamiseks, samas kui ümbritsev ruum on ruum, mis ümbritseb matemaatilist objekti. Nüüd võib matemaatilist objekti mõista abstraktse objektina, mida ei eksisteeri mingil ajal ega kohas, vaid eksisteerib teatud tüüpi asjana.

3. Gaussi protsess

Gaussi protsess sai nime Cark Friedrich Gauss, kuna see kasutab Gaussi jaotuse (normaaljaotuse) märget. See on stohhastiline protsess, mis tähendab juhuslike muutujate kogumit, mida on indekseeritud aja või ruumi järgi. Gaussi protsessis on juhuslikel muutujatel mitme muutujaga normaaljaotus, st kõik selle lõplikud lineaarsed kombinatsioonid jagunevad tavaliselt. Gaussi protsess kasutab normaaljaotusest päritud omadusi ja on seetõttu statistilisel modelleerimisel kasulikud. Masinõppe algoritm, mis hõlmab seda kerneli meetodit, kasutab laisa õppimise mõõtmist ja punktide sarnasust, et prognoosida treeningandmetest nähtamatute punktide väärtust. See ennustus ei ole ainult hinnang, vaid ka sel hetkel ebakindlus.

4. Kanooniline korrelatsioonianalüüs

Kanooniline korrelatsioonianalüüs on viis järelduste tegemiseks kovariatsioonidevahelistest maatriksitest. Seda tuntakse ka kanooniliste muutujate analüüsina. Oletame, et meil on kaks juhusliku muutujaga vektorit X, Y, näiteks kaks vektorit X = (X1, …, Xn) ja vektor Y = (Y1, …, Ym) ja muutujal on korrelatsioon, siis arvutab CCA X-i lineaarse kombinatsiooni ja Y, millel on üksteise suhtes maksimaalne korrelatsioon.

5. Spektri klasterdamine

Kujutise segmenteerimise rakendamisel nimetatakse spektraalklastrimist segmenteerimisel põhinevaks objektide kategoriseerimiseks. Spektrirühmituse korral viiakse mõõtmete vähendamine enne väiksema mõõtmega rühmitamist läbi, kasutades selleks andmete sarnasusmaatriksi omaväärtust. Selle juured on graafiteoorias, kus seda lähenemisviisi kasutatakse sõlmekoosluste tuvastamiseks graafil, mis põhineb neid ühendavatel servadel. See meetod on piisavalt paindlik ja võimaldab meil klastrida ka mittegraafilisi andmeid.

6. Adaptiivne filter

Adaptiivne filter kasutab lineaarset filtrit, mis sisaldab ülekandefunktsiooni, mida juhitakse muutuvate parameetrite abil, ja meetodeid, mida kasutatakse nende parameetrite kohandamiseks vastavalt optimeerimisalgoritmile. Selle optimeerimisalgoritmi keerukus on põhjuseks, et kõik adaptiivsed filtrid on digitaalsed filtrid. Adaptiivset filtrit on vaja nendes rakendustes, kus soovitud töötlemistoimingu kohta pole eelnevat teavet või need muutuvad.

Kulufunktsiooni kasutatakse suletud ahelaga adaptiivses filtris, kuna see on vajalik filtri optimaalse jõudluse tagamiseks. See määrab, kuidas muuta filtri ülekandefunktsiooni, et vähendada järgmise iteratsiooni kulusid. Üks levinumaid funktsioone on tõrkesignaali ruutkeskmine viga.

7. Kernel Perceptron

Masinaõppes on kerneli perceptroon populaarse perceptroni õppimisalgoritmi tüüp, mis suudab õppida kerneli masinaid, näiteks mittelineaarsed klassifikaatorid, mis kasutavad kerneli funktsiooni, et arvutada välja nende proovide sarnasus, mida nähtamatute treenimisproovide jaoks pole. See algoritm leiutati 1964. aastal, tehes sellest esimese tuuma klassifitseerimise õppija.

Enamik käsitletud kerneli algoritme põhineb kumeral optimeerimisel või omaprobleemidel ja on statistiliselt hästi põhjendatud. Nende statistilisi omadusi analüüsitakse statistilise õppe teooria abil.

Tuumameetodite rakendusaladest rääkides on see mitmekesine ja hõlmab geostatistikat, krigimist, pöördvõrdeliste raskuste kaalumist, 3D rekonstrueerimist, bioinformaatikat, kemoinformaatikat, teabe eraldamist ja käekirjatuvastust.

Järeldus

Olen kokku võtnud mõned masinõppes kasutatavate tuumameetodite terminoloogiad ja tüübid. Ruumipuuduse tõttu pole see artikkel kaugeltki kõikehõlmav ja on mõeldud lihtsalt selleks, et saada teile aru, mis on kerneli meetod, ja nende tüüpide lühikokkuvõtte. Selle artikli katmine paneb teid siiski astuma esimese sammu masinõppe valdkonnas.

Soovitatavad artiklid

See on tuumameetodi juhend masinõppes. Siin käsitleme 7 tuumameetodi tüüpi masinõppes. Võite vaadata ka järgmist artiklit.

  1. Monoliitne tuum
  2. Klastrid masinõppes
  3. Andmeteaduse masinõpe
  4. Juhendamata masinõpe
  5. PHP filtrid | Kuidas kontrollida kasutajate sisestust erinevate filtrite abil?
  6. Masinaõppe elutsükli täielik juhend

Kategooria: