Sissejuhatus närvivõrgu klassifikatsiooni

Neuraalvõrgud on kõige tõhusam viis (jah, lugesite õigesti) tehisintellekti reaalainete probleemide lahendamiseks. Praegu on see ka üks informaatika alal palju uuritud valdkondi, et selle artikli lugemise ajal oleks välja töötatud uus neurovõrgu vorm. Erinevatele domeenidele iseloomulike probleemide lahendamiseks on sadu närvivõrke. Siin tutvustame teid erinevat tüüpi peamistest närvivõrkudest järjest keerukamaks muutuvas järjekorras.

Erinevad tüübid närvivõrkude klassifitseerimisel

1. Madalad närvivõrgud (ühine filtreerimine)

Neuraalsed võrgud on loodud Perceptroni rühmadest, et simuleerida inimese aju närvistruktuuri. Madalatel närvivõrkudel on perceptrooni üks varjatud kiht. Madalate närvivõrkude üks levinumaid näiteid on koostöö filtreerimine. Perceptroni peidetud kiht koolitatakse esindama olemitevahelisi sarnasusi, et genereerida soovitusi. Netflixi, Amazoni, YouTube'i jms soovitustesüsteem kasutab oma toodete soovitamiseks vastavalt kasutajate huvidele ühiste filtreerimise versiooni.

2. Mitmekihiline perceptron (sügavad närvivõrgud)

Neuruvõrgustikke, millel on rohkem kui üks varjatud kiht, nimetatakse sügavateks närvivõrgustikeks. Spoileri teade! Kõik järgmised närvivõrgud on sügava närvivõrgu vorm, mida on kohandatud / parendatud domeenipõhiste probleemide lahendamiseks. Üldiselt aitavad need meil saavutada universaalsust. Arvestades piisavat arvu neuroni varjatud kihte, suudab sügav närvivõrk ligikaudselt st lahendada mis tahes keeruka reaalprobleemi.

Universaalse lähenemise teoreem on sügavate närvivõrkude tuum, et treenida ja sobitada mis tahes mudelit. Sügava närvivõrgu iga versiooni arendab maatriksi korrutamise maksimaalselt ühendatud toote täielikult ühendatud kiht, mida optimeeritakse tagasitoomise algoritmide abil. Jätkame täienduste õppimist, mille tulemuseks on sügavate närvivõrkude erinevad vormid.

3. Konvolutsiooniline närvivõrk (CNN)

CNN-id on sügavaimate närvivõrkude kõige küpsem vorm, mis annavad arvutinägemise korral kõige täpsemad, st inimesest paremad tulemused. CNN-id on tehtud konvolutsioonikihtidest, mis on loodud andmekogu iga pildi piksli skannimisel. Kuna andmed saadakse kihtide kaupa ligikaudseks, hakkavad CNN-d mustrid ära tundma ja seeläbi piltide objekte ära tundma. Neid objekte kasutatakse laialdaselt erinevates identifitseerimise, klassifitseerimise jms rakendustes. Hiljutised tavad, näiteks CNN-ide ülekandmisõpe, on mudelite ebatäpsusi märkimisväärselt parandanud. Google Translator ja Google Lens on CNN-i kõige kaasaegsemad näited.

CNN-de rakendamine on eksponentsiaalne, kuna neid kasutatakse isegi selliste probleemide lahendamisel, mis pole peamiselt seotud arvuti nägemisega. CNN-ide väga lihtsa, kuid intuitiivse selgituse leiate siit.

4. Korduv närvivõrk (RNN)

RNN-id on sügavamate närvivõrkude kõige uuem vorm probleemide lahendamiseks NLP-s. Lihtsustatult öeldes suunavad RNN-id mõne varjatud kihi väljundi sisendkihti tagasi, et koondada ja viia sisestusandmete järgmise iteratsiooni (epohhi) lähendamine edasi. Samuti aitab see mudelil ise õppida ja korrigeerib ennustusi mingil määral kiiremini. Sellised mudelid on NLP toimingutes teksti semantika mõistmisel väga kasulikud. RNN-del on erinevaid variante, näiteks pikaajaline mälu (LSTM), korduvvärav (GRU) jne. Alloleval skeemil toidetakse h1 ja h2 aktiveerimist vastavalt sisenditega x2 ja x3.

5. Pikaajaline lühimälu (LSTM)

LSTM-id on loodud spetsiaalselt RNN-i kaduvate kallete probleemide lahendamiseks. Kaduvad gradiendid juhtuvad suurte närvivõrkudega, kus kadumisfunktsioonide gradiendid lähevad nullile lähemale, muutes närvivõrkude õppimise peatamiseks. LSTM lahendab selle probleemi, takistades aktiveerimisfunktsioone oma korduvates komponentides ja lastes salvestatud väärtused mutteerida. See väike muudatus andis lõppmudelis suuri parandusi, mille tulemusel kohandasid tehnikahiiglased LSTM-i oma lahendustes. LSTMi kõige lihtsamate iseenesestmõistetavate näidete juurde,

6. Tähelepanupõhised võrgustikud

Tähelepanumudelid võtavad praktikas aeglaselt üle isegi uued RNN-id. Tähelepanu mudelid on üles ehitatud, keskendudes osale nende antud teabe alamhulgale, välistades nii suure hulga taustteavet, mida pole vaja antud ülesande jaoks. Tähelepanu mudelid on ehitatud koos pehme ja raske tähelepanuga ning sobivad pehmet tähelepanu tagasi levitades. Mitmeid hierarhiliselt virnastatud tähelepanu mudeleid nimetatakse trafodeks. Need trafod on tõhusamad virnade paralleelseks käitamiseks, nii et need annavad tehnika taseme tulemusi suhteliselt väiksema andmemahu ja ajaga mudeli koolitamiseks. Tähelepanu jaotus muutub CNN / RNN-iga kasutamisel väga võimsaks ja suudab pildile teksti kirjeldada järgmiselt.

Tehnikahiiglased nagu Google, Facebook jne kohandavad oma lahenduste loomiseks kiiresti tähelepanu mudeleid.

7. Generatiivne võistlusvõrgustik (GAN)

Ehkki süvaõppe mudelid pakuvad nüüdisaegseid tulemusi, saavad neid palju intelligentsemad inimkaaslased petta, lisades reaalainete andmetele müra. GAN-id on sügava õppe uusim areng selliste stsenaariumide lahendamiseks. GANid kasutavad juhendamata õpet, kus sügavad närvivõrgud treenitakse AI mudeli genereeritud andmetega koos tegeliku andmestikuga, et parandada mudeli täpsust ja tõhusust. Neid võistlevaid andmeid kasutatakse enamasti diskrimineeriva mudeli petmiseks, et luua optimaalne mudel. Saadud mudel kipub olema parem lähend, kui suudab sellisest mürast üle saada. Teaduslik huvi GANide vastu on viinud keerukamate juurutamisteni, nagu näiteks tingimuslik GAN (CGAN), Laplacian Pyramid GAN (LAPGAN), Super Resolution GAN (SRGAN) jne.

Järeldus - närvivõrgu klassifikatsioon

Sügavad närvivõrgud on surunud arvutite piire. Need ei piirdu ainult klassifitseerimisega (CNN, RNN) ega ennustustega (koostöö filtreerimine), vaid isegi andmete genereerimisega (GAN). Need andmed võivad varieeruda kaunist kunstivormist kuni vastuoluliste sügavate võltsideni, kuid siiski ületavad nad inimesi iga päev ülesandega. Seetõttu peaksime arvestama ka AI eetika ja mõjuga, samal ajal kõvasti tööd tehes, et luua tõhus närvivõrgu mudel. Aeg korraliku neurovõrkude kohta käiva infograafika saamiseks.

Soovitatavad artiklid

See on närvivõrgu klassifikatsiooni juhend. Siin arutasime erinevaid põhiliste närvivõrkude tüüpe. Lisateavet leiate ka meie antud artiklitest -

  1. Mis on närvivõrgud?
  2. Neuraalvõrgu algoritmid
  3. Võrgu skaneerimise tööriistad
  4. Korduvad närvivõrgud (RNN)
  5. Kuus parimat võrdlust CNN-i ja RNN-i vahel

Kategooria: