Sissejuhatus piiratud Boltzmanni masinasse

Piiratud Boltzmanni masin on meetod, mille abil saab meie sisendi rekonstrueerimisel automaatselt leida andmetes mustrid. Geoff Hinton on sügava õppimise rajaja. RBM on pealiskaudne kahekihiline võrk, milles esimene on nähtav ja järgmine on peidetud kiht. Kõik nähtava kihi üksikud sõlmed on ühendatud peidetud kihi iga üksikuga. Piiratud Boltzmanni masinat peetakse piiratuks, kuna sama kihi kaks sõlme ei moodusta ühendust. RBM on kahesuunalise tõlgi arvuline ekvivalent. Edasisuunas võtab RBM sisendi vastu ja teisendab selle sisendit kodeerivaks numbrikomplektiks. Tagasi kulgedes võtab see selle tulemusena ja töötleb selle sisendite komplekti ja tõlgib need vastupidiselt, et moodustada sisendatud sisendid. Üliväljaõppe saanud võrk suudab seda tagurpidi üleminekut teostada suure täpsusega. Kahes etapis on kaalul ja väärtustel väga oluline roll. Need võimaldavad RBM-il dekodeerida sisenditevahelisi suhteid ja aitavad ka RBM-il otsustada, millised sisendväärtused on õigete väljundite tuvastamisel kõige olulisemad.

Piiratud Boltzmanni masina töö

Iga nähtav sõlm saab andmestiku sõlmest madala taseme väärtuse. Nähtamatu kihi esimeses sõlmes moodustatakse X massi korrutisest ja lisatakse nihkega. Selle protsessi tulemus suunatakse aktiveerimisele, mis annab antud sisendsignaali või sõlme väljundi võimsuse.

Järgmises protsessis ühinevad mitu sisendit ühes peidetud sõlmes. Iga X ühendatakse individuaalse kaaluga, toote lisamine väärtustatakse ja tulemus edastatakse uuesti aktiveerimise teel, et saada sõlme väljund. Igas nähtamatus sõlmes ühendatakse iga sisend X individuaalse kaalu W abil. Sisendil X on siin kolm kaalu, mis teeb kokku kaksteist. Kihi vahel moodustatud massist saab massiivi, kus read on sisestussõlmede täpsusega ja veerud rahuldatud väljundsõlmedega.

Iga nähtamatu sõlm saab neli vastust, mis on korrutatud nende kaaluga. Selle efekti lisamine lisab taas väärtust. See toimib mõne aktiveerimisprotsessi katalüsaatorina ja tulemus suunatakse uuesti aktiveerimisalgoritmi, mis loob iga nähtamatu sisendi jaoks iga väljundi.

Esimene siin tuletatud mudel on energiapõhine mudel. See mudel seob skalaarenergia muutuja iga konfiguratsiooniga. See mudel määratleb tõenäosusjaotuse energiafunktsiooni kaudu järgmiselt:

(1)

Z on siin normaliseerimisfaktor. See on füüsiliste süsteemide osas partitsioonifunktsioon

Selles energiapõhises funktsioonis järgitakse logistilist regressiooni, et esimene samm määratleb logi. tõenäosus ja järgmine määratleb kaotuse funktsiooni negatiivse tõenäosusena.

kasutades stohhastilist gradienti, kus on parameetrid,

varjatud ühikuga energiapõhine mudel on määratletud kui „h”

Vaadeldud osa tähistatakse tähega x

Võrrandist (1) on vaba energia F (x) võrrand defineeritud järgmiselt

(2)

(3)

Negatiivsel gradiendil on järgmine vorm,

(4)

Ülaltoodud võrrandil on kaks vormi: positiivne ja negatiivne vorm. Terminit positiivne ja negatiivne pole võrrandite märkidega. Need näitavad tõenäosustiheduse mõju. Esimene osa näitab vastava vaba energia vähendamise tõenäosust. Teises osas on näidatud proovide tõenäosuse vähendamine. Seejärel määratakse gradient järgmiselt:

(5)

N on siin negatiivsed osakesed. Selles energiapõhises mudelis on gradienti analüütiliselt keeruline tuvastada, kuna see sisaldab ka gradiendi arvutamist

Seetõttu on selles EBM-mudelis lineaarne vaatlus, mis ei suuda andmeid täpselt kuvada. Nii et järgmises mudelis Piiratud Boltzmanni masin on varjatud kihil pigem kõrge täpsus ja andmekao ärahoidmine. RBM energiafunktsioon on määratletud järgmiselt:

(6)

Siin tähistab W nähtavate ja varjatud kihtide vahelist kaalu. b on nähtava kihi nihkes.c varjatud kihi nihkes. muundades vabaks energiaks,

RBM-is on nähtava ja peidetud kihi ühikud täiesti sõltumatud, mida saab kirjutada järgmiselt:

Võrranditest 6 ja 2 on neuronite aktiveerimise funktsiooni tõenäoline versioon,

(7)

(8)

Seda on veelgi lihtsustatud

(9)

5 ja 9 ühendades

(10)

Proovide võtmine piiratud Boltzmanni masinas

Gibbsi proovide võtmine N juhusliku muutuja ühisest viiakse läbi vormi N proovide võtmise alaetappide jada kaudu kus

sisaldab - muud juhuslikud muutujad välja arvatud.

RBM-is on S nähtavate ja peidetud üksuste komplekt. Need kaks osa on sõltumatud, mis võivad Gibbsi proovivõtu teostada või seda blokeerida. Siin teeb nähtav üksus proovivõtmise ja annab varjatud üksustele fikseeritud väärtuse, samal ajal kui varjatud üksused andsid proovivõtmise teel nähtavale üksusele fikseeritud väärtused

siin on kõigi peidetud üksuste komplekt. Näide on juhuslikult valitud 1 (versus 0) tõenäosusega, ja samamoodi on juhuslikult valitud tõenäosusega 1 (versus 0)

Kontrastiivne erinevus

Seda kasutatakse katalüsaatorina proovivõtmise kiirendamiseks
Kuna loodame olla tõsi, siis eeldame jaotusväärtus peab olema P lähedal, nii et see moodustaks lähenemise P lõplikule jaotusele

Kuid kontrastiivne lahknemine ei oota ahela lähenemist. Proov saadakse alles pärast Gibbi protsessi, nii et siin seatakse k = 1, kus see töötab üllatavalt hästi.

Püsiv kontrastiivne lahknemine

See on veel üks proovivõtmise vormi lähendamise meetod. See on püsiv olek iga proovivõtumeetodi jaoks, mille käigus ekstraheeritakse uued proovid, muutes lihtsalt K parameetreid.

Piiratud Boltzmanni masina kihid

Piiratud Boltzmanni masinal on kaks kihti, madalad närvivõrgud, mis koos moodustavad sügava usu võrkude ploki. Esimene kiht on nähtav kiht ja teine ​​kiht on peidetud kiht. Iga ühik osutab neuronitaolisele ringile, mida nimetatakse sõlmeks. Peidetud kihi sõlmed on ühendatud nähtava kihi sõlmedega. Kuid sama kihi kaks sõlme pole omavahel ühendatud. Siin tähendab termin Piiratud, et puudub kihisisene suhtlus. Iga sõlm töötleb sisendit ja teeb stohhastilise otsuse, kas edastada sisend või mitte.

Näited

RBM-i oluline roll on tõenäosusjaotus. Keeled on oma tähtede ja häälikute poolest ainulaadsed. Tähe tõenäosusjaotus võib olla kõrge või madal. Inglise keeles on tähed T, E ja A laialdaselt kasutusel. Kuid islandi keeles on tavalised tähed A ja N. Me ei saa proovida rekonstrueerida islandi keelt inglise keele kaaluga. See toob kaasa erinevused.

Järgmine näide on pildid. Nende piksli väärtuse tõenäosusjaotus on igat tüüpi piltide puhul erinev. Võime arvestada, et pukseerimissõlmede jaoks on kaks pilti Elevant ja Koer. RBM-i edasipääs tekitab sellise küsimuse, nagu peaksin genereerima tugeva pikslisõlme elevandi- või koerasõlme jaoks ?. Siis genereerib tagasisõit küsimusi näiteks elevandi kohta. Kuidas peaksin eeldama pikslite jaotust? Siis koos liigeste tõenäosusega ja sõlmede poolt aktiveerumisega konstrueerivad nad võrgu, millel on ühine esinemine: suured kõrvad, hallid mittelineaarsed torud, disketikõrvad, korts on elevant. Seega on RBM sügava õppimise ja visualiseerimise protsess, mis moodustab kaks peamist kallutatust ja toimib nende aktiveerimise ja rekonstrueerimise mõttes.

Piiratud Boltzmanni masina eelised

  • Piiratud Boltzmanni masinas kasutatakse algoritmi, mida kasutatakse klassifitseerimisel, regressioonil, teema modelleerimisel, koostööl põhineval filtreerimisel ja funktsioonide õppimisel.
  • Piiratud Boltzmanni masinat kasutatakse neuropildistamiseks, hõreda pildi rekonstrueerimiseks miinide kavandamisel ja ka radari sihtmärgi tuvastamisel
  • RBM suudab lahendada tasakaalustamata andmete probleemi SMOTE protseduuri abil
  • RBM leiab puuduvad väärtused Gibbi proovivõtmise teel, mida kasutatakse tundmatute väärtuste katmiseks
  • RBM lahendab mürarikast siltide probleemi parandamata siltide andmete ja selle rekonstrueerimise vigade abil
  • Probleemne struktureerimata teave on parandatud funktsioonide ekstraheerija abil, mis muudab töötlemata andmed peidetud üksusteks.

Järeldus

Süvaõpe on väga võimas, mis on keerukate probleemide lahendamise kunst, see on siiski arenguruum ja keeruline rakendada. Vabad muutujad tuleb hoolikalt konfigureerida. Neuraalvõrgu ideed olid varem rasked, kuid tänapäeval on sügav õppimine masinõppe ja tehisintellekti jaam. Seetõttu annab RBM ülevaate tohututest sügava õppimise algoritmidest. See käsitleb kompositsiooni põhiüksust, mis on järk-järgult kasvanud paljudeks populaarseteks arhitektuurideks ja mida kasutatakse laialdaselt paljudes suurtes tööstusharudes.

Soovitatav artikkel

See on olnud piiratud Boltzmanni masina juhend. Siin räägime selle tööst, proovide võtmisest, eelistest ja piiratud Boltzmanni masina kihtidest. Lisateavet leiate ka meie teistest soovitatud artiklitest _

  1. Masinõppe algoritmid
  2. Masinõppe arhitektuur
  3. Masinõppe tüübid
  4. Masinõppe tööriistad
  5. Neuraalsete võrkude rakendamine

Kategooria: