Süvaõppe tehnika - Kuidas luua süvaõppe mudeleid?

Lang L: none (table-of-contents):

Anonim

Sissejuhatus süvaõppe tehnikasse

Süvaõppe tehnika põhineb tehislikel närvivõrkudel, mis toimivad nagu inimese aju. See jäljendab inimese aju mõtlemis- ja toimimisviisi. Selles mudelis õpib süsteem klassifikatsiooni piltide, teksti või heli järgi ja teostab seda. Süvaõppe mudeleid treenitakse suurte märgistatud ja mitmekihiliste andmete abil, et saavutada tulemuse kõrge täpsus isegi inimlikust tasemest kõrgemal. Juhita auto rakendab seda tehnoloogiat liikumises stoppmärgi, jalakäija jms tuvastamiseks. Elektroonilistel vidinatel, nagu mobiilid, kõlarid, teler, arvutid jne, on sügava õppimise tõttu hääljuhtimisfunktsioon. See tehnika on uus ja tõhus nii tarbijate kui ka organisatsioonide jaoks.

Süvaõppe toimimine

Süvaõppe meetodites kasutatakse närvivõrke. Neid nimetatakse sageli sügavateks närvivõrkudeks. Sügavatel või varjatud närvivõrkudel on mitu peidetud sügavate võrkude kihti. Deep Learning treenib AI-d teatud sisendite või peidetud võrgukihtide abil väljundi ennustamiseks. Neid võrke koolitavad suured märgistatud andmestikud ja nad õpivad ise andmetest funktsioone. Nii juhendatud kui ka juhendamata õpe töötab andmete koolitamisel ja funktsioonide genereerimisel.

Ülaltoodud ringid on omavahel ühendatud neuronid. Seal on 3 tüüpi neuroneid:

  • Sisendkiht
  • Peidetud kiht (kihid)
  • Väljundkiht

Sisendkiht saab sisendandmed ja edastab sisendi esimesele peidetud kihile. Matemaatilised arvutused tehakse sisendandmetega. Lõpuks annab väljundkiht järeldused.

CNN ehk tavalised närvivõrgud, üks populaarseimaid närvivõrgustikke, sisaldab sisestusandmetest õpitud funktsioone ja kasutab 2D-d konvolutsioonilisi kihte, et muuta see sobivaks 2D-andmete nagu piltide töötlemiseks. Niisiis, CNN vähendab sel juhul funktsioonide käsitsi ekstraheerimise kasutamist. See eraldab piltidelt klassifitseerimiseks vajalikud omadused. Selle automatiseerimisfunktsiooni tõttu on CNN masinõppes enamasti täpne ja usaldusväärne algoritm. Iga CNN õpib peidetud kihist piltide omadusi ja need varjatud kihid suurendavad õpitud piltide keerukust.

Oluline osa on AI või närvivõrkude koolitamine. Selleks anname sisendi andmestikust ja võrdleme lõpuks väljundit andmestiku väljundi abil. Kui AI on koolitamata, võib väljund olla vale.

Et teada saada, kui vale on AI väljund tegelikust väljundist, vajame arvutamiseks funktsiooni. Funktsiooni nimetatakse kulufunktsiooniks. Kui kulufunktsioon on null, siis on nii AI väljund kui ka tegelik väljund samad. Kulufunktsiooni väärtuse vähendamiseks muudame neuronite vahelisi kaalu. Mugavaks lähenemiseks võib kasutada tehnikat nimega Gradient Descent. GD vähendab pärast iga iteratsiooni neuronite massi miinimumini. See protsess toimub automaatselt.

Süvaõppe tehnika

Süvaõppe algoritmid jooksevad läbi peidetud kihtide või närvivõrkude mitme kihi. Nii õpivad nad piltide kohta täpset ennustamist põhjalikult. Iga kiht õpib tundma ja tuvastab madala taseme funktsioone, näiteks servi, ning uus kiht ühildub varasema kihi omadustega, et neid paremini kuvada. Näiteks võib keskmine kiht tuvastada objekti mis tahes serva, samal ajal kui peidetud kiht tuvastab kogu objekti või pildi.

See tehnika on efektiivne suurte ja keerukate andmetega. Kui andmed on väikesed või puudulikud, muutub DL uute andmetega töötamiseks võimetuks.

Seal on mõned sügavõppevõrgud:

  • Järelevalveta eelkoolitatud võrk : see on põhimudel, millel on 3 kihti: sisend-, peidetud ja väljundkiht. Võrku õpetatakse sisendi rekonstrueerimiseks ja seejärel õpivad peidetud kihid sisenditest teabe kogumiseks ja lõpuks eraldatakse pildist funktsioonid.
  • Tavaline närvivõrk : standardse närvivõrgustikuna on sellel servade serv tuvastamiseks ja objektide täpseks tuvastamiseks keerukas.
  • Korduv närvivõrk : Selle meetodi korral kasutatakse eelmise etapi väljundit järgmise või praeguse etapi sisendina. RNN salvestab teabe kontekstisõlmedesse, et õppida sisendandmeid ja koostada väljund. Näiteks lause täitmiseks vajame sõnu. st järgmise sõna ennustamiseks on vaja eelnevaid sõnu, mis tuleb meelde jätta. RNN lahendab seda tüüpi probleemid põhimõtteliselt.
  • Rekursiivsed närvivõrgud : see on hierarhiline mudel, kus sisendiks on puu-sarnane struktuur. Selline võrk luuakse, rakendades sisendite kokkupanemisel samu kaalukomplekte.

Deep Learning on omandanud mitmesuguseid rakendusi finantsvaldkonnas, arvuti nägemises, heli- ja kõnetuvastuses, meditsiinilises pildianalüüsis, ravimite kujundamise tehnikates jne.

Kuidas luua süvaõppe mudeleid?

Süvaõppe algoritmid valmistatakse nende vahel kihte ühendades. Esimene samm ülalpool on sisendkiht, millele järgneb peidetud kiht (kihid) ja väljundkiht. Iga kiht koosneb omavahel seotud neuronitest. Võrk kulutab suurel hulgal sisendandmeid, et neid mitme kihi kaudu hallata.

Süvaõppe mudeli loomiseks on vaja järgmisi samme:

  • Probleemi mõistmine
  • Andmete tuvastamine
  • Valige algoritm
  • Treenige mudelit
  • Katsetage mudelit

Õppimine toimub kahes faasis

  • Rakendage sisendandmete mittelineaarset teisendust ja looge väljundina statistiline mudel.
  • Mudeli täiustatakse tuletusmeetodil.

Neid kahte operatsiooni faasi nimetatakse iteratsiooniks. Neuraalvõrgud korrake kahte sammu, kuni soovitud väljund ja täpsus on loodud.

1. Võrkude väljaõpe: Andmevõrgu koolitamiseks kogume palju andmeid ja kujundame funktsioonide õppimiseks mudeli. Kuid väga suure hulga andmete korral on protsess aeglasem.

2. Ülekandeõpe: ülekandeõpe keerab põhimõtteliselt eelnevalt koolitatud mudeli ja pärast seda tehakse uus ülesanne. Selles protsessis väheneb arvutusaeg.

3. Funktsioonide eraldamine: pärast kõigi kihtide väljaõpet objekti omaduste osas eraldatakse sellest objektid ja nende väljundit ennustatakse täpsusega.

Järeldus

Deep Learning on ML alamhulk ja ML on AI alamhulk. Kõigil kolmel tehnoloogial ja mudelil on tohutu mõju tegelikule elule. Äriüksused ja kaubanduslikud hiiglased rakendavad sügava õppe mudeleid, et saada automatiseeritud tulemusi, mis on inspireeritud inimeste ajudest, suurepäraste ja võrreldavate tulemuste saamiseks.

Soovitatavad artiklid

See on süvaõppe tehnika juhend. Siin arutatakse, kuidas luua süvaõppe mudeleid koos kahe tööfaasiga. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -

  1. Mis on sügav õppimine
  2. Karjäär süvaõppes
  3. 13 kasuliku sügava õppimisega intervjuu küsimust ja vastust
  4. Hüperparameetri masinõpe