Mis on masinõpe?

Masinõpe on tehisintellekti väike rakendusala, kus masinad õpivad automaatselt toimingutest ja viimistlevad end parema väljundi saamiseks. Kogutud andmete põhjal kalduvad masinad töötama arvutiprogrammide vajaliku väljundiga vastavusse viimise nimel. Kuna masin suudab iseseisvalt õppida, pole nende arvutite selgesõnaline programmeerimine vajalik. See on meie ellu juba kõikjal sisse imbunud, ilma et oleksime teadnud. Praktiliselt iga masin, mida me kasutame, ja arenenud tehnoloogiaga masinad, mille tunnistajaks oleme olnud viimasel kümnendil, on toodete kvaliteedi tõstmiseks integreerinud masinõppe. Mõned masinõppe näited on isesõitvad autod, täpsemad veebiotsingud, kõnetuvastus.

Inimeste peamine eesmärk on töötada välja masinate õppimisalgoritm viisil, mis aitab masinatel automaatselt õppida ilma igasuguse inimese sekkumiseta. Õppimine sõltub aga sisestatud andmetest, kus masinad jälgivad ja tunnevad ära mõned mustrid ja suundumused. Iga uue andmepunktiga paraneb masina mõistmine ning väljund on paremini joondatud ja töökindel. Andmed võivad olla arvväärtused, otsesed kogemused, pildid jne, mis aitab kaasa ka sellele, kuidas läheneme masinaõppe abil igale probleemile, mida me tahtsime lahendada. Samuti on olemas erinevat tüüpi masinõppe lähenemisviise, mis põhinevad vajalikul väljundil.

Erinevus tavapärase programmeerimise ja masinõppe vahel

Tavaline programmeerimine = loogika on programmeeritud + andmed sisestatakse + loogika käivitatakse andmetega + väljund

Masinõpe = andmed sisestatakse + eeldatav väljund sisestatakse + käivitage see masinas algoritmi treenimiseks sisendist väljundini, lühidalt öeldes laske sellel luua oma loogika sisendist väljundini jõudmiseks + treenitud algoritm, mida kasutatakse testiandmetes ennustamiseks

Masinõppe meetodid

Meil on neli peamist tüüpi masinõppe meetodit, mis põhinevad sellel algtüübilt, mida me eeldame:

1. Juhendatud masinõpe

Kui väljund on klassifitseeritud või märgistatud, kasutatakse juhendatud õppe algoritme. Need algoritmid õpivad sisestatud varasemate andmete põhjal, mida nimetatakse treeningandmeteks, käivitab selle analüüsi ja kasutab seda analüüsi teadaolevates klassifikaatorites sisalduvate uute andmete tulevaste sündmuste ennustamiseks. Testi andmete täpseks ennustamiseks on vaja suuri andmeid, et mustritest piisaval määral aru saada. Algoritmi saab edasi treenida, kui võrrelda treeningu väljundeid tegelikega ja kasutada vigu algoritmide muutmiseks.

Näide päriselust:

  • Kujutise klassifikatsioon - algoritm on koostatud sildistatud pildiandmete abil. Koolitatakse algoritm ja eeldatakse, et uue pildi korral klassifitseerib algoritm selle õigesti.
  • Turu ennustamine - seda nimetatakse ka regressiooniks. Ettevõtte ajaloolised andmed sisestatakse arvutisse. Analüüsi ja regressioonialgoritmi abil ennustatakse sõltuvalt muutujatest uut tuleviku hinda.

Liigume järgmiste peamiste masinõppemeetodite tüüpide juurde.

2. Juhendamata masinõpe

Kui me pole lõplikest väljunditest teadlikud ja kui klassifikatsiooni või märgistusega väljundeid pole meie käsutuses, kasutatakse järelevalveta õppealgoritme. Need algoritmid uurivad ja genereerivad funktsiooni täiesti varjatud ja sildistamata mustrite kirjeldamiseks. Seega pole õiget väljundit, kuid uuritakse andmeid, et saada sildistamata andmetes tundmatuid struktuure.

Näide päriselust:

  • Klasterdamine - sarnaste tunnustega andmeid palutakse algoritmi järgi rühmitada, seda rühmitust nimetatakse klastriteks. Need osutuvad kasulikuks nende rühmade uurimisel, mida saab enam-vähem kogu klastri andmete jaoks rakendada.
  • Kõrgmõõtmelised andmed - kõrgmõõtmeliste andmetega pole tavaliselt kerge töötada. Juhendamata õppe abil on võimalik kõrgmõõtmeliste andmete visualiseerimine
  • Generatiivsed mudelid - kui teie algoritm on analüüsitud ja sisendite tõenäosusjaotuse esitatud, saab seda kasutada uute andmete genereerimiseks. See osutub andmete puudumise korral väga kasulikuks.

3. Armeerimismasinate õppimine

Seda tüüpi masinõppe algoritm kasutab katse-eksituse meetodit väljundi muutmiseks funktsiooni kõrgeima efektiivsuse alusel. Väljundit võrreldakse vea ja tagasiside leidmiseks, mis suunatakse süsteemi tagasi, et selle toimivust parendada või maksimeerida. Mudel on varustatud preemiatega, mis on põhimõtteliselt tagasiside ja karistused selle tegevuses konkreetse eesmärgi täitmise ajal.

4. Pooljuhendatud masinõpe

Need algoritmid kasutavad tavaliselt märgistatud ja sildistamata andmeid, kui märgistamata andmemaht on märgistatud andmetega võrreldes suur. Kuna see töötab nii juhendatud kui ka juhendamata õppealgoritmidega ning nende vahel, kutsutakse seetõttu pooljuhendatud masinõppeks. Näidatakse, et neid mudeleid kasutavatel süsteemidel on parem õppimise täpsus.

Näide - pildiarhiiv võib sisaldada ainult osa selle märgistatud andmetest, nt. Koer, kass, hiir ja suur osa pilte jäävad sildistamata.

Algoritmide väljundite alusel põhinevad mudelid

Allpool on toodud masinõppe mudelite tüübid, mis põhinevad väljunditel, mida me algoritmidelt ootame:

1. Klassifikatsioon

Sisendid on jagatud klasside kaupa, süsteem koostab treeningandmetest mudeli, milles ta määrab ühele neist klassidest uued sisendid

See kuulub juhendatud õppe katuse alla. Tegeliku elu näiteks võib olla rämpsposti filtreerimine, kus e-kirjad on sisend, mis on klassifitseeritud rämpspostiks või rämpspostita.

2. Regressioon

Regressioonialgoritm on samuti osa juhendatud õppest, kuid erinevus seisneb selles, et väljundid on pidevad muutujad ega ole diskreetsed.

Näide - majahindade prognoosimine varasemate andmete abil

3. Mõõtmete vähendamine

Seda tüüpi masinõpe on seotud sisendite analüüsi ja nende redutseerimisega ainult asjakohasteks, mida mudeli väljatöötamiseks kasutada. Funktsioonide valimine, st sisendi valimine ja funktsioonide eraldamine, on mõõtmete vähendamise paremaks mõistmiseks vajalikud täiendavad teemad.

Ülaltoodud erinevate lähenemisviiside põhjal on kaaluda erinevaid algoritme. Mõned väga levinud algoritmid on lineaarne ja logistiline regressioon, K-lähimad naabrid, otsustuspuud, tugivektorimasinad, juhuslik mets jne. Nende algoritmide abil võivad keerulised otsustusprobleemid omada suunatunnet, mis põhineb tohutul hulgal andmeid . Selle täpsuse ja võimaluste saavutamiseks tuleb pakkuda nii lisaressursse kui ka aega. Masinaõpe, mida kasutatakse koos tehisintellekti ja muude tehnoloogiatega, on teabe töötlemiseks tõhusam.

Soovitatavad artiklid

See on olnud masinõppe tüüpide juhend. Siin arutasime algoritmide kontseptsiooni, erinevat meetodit ja teistsugust mudelit. Lisateavet leiate ka meie muudest soovitatud artiklitest -

  1. Masinõppe tehnikad
  2. Mis on sügav õppimine
  3. Mis on masinõpe?
  4. Sissejuhatus masinõppesse
  5. Hüperparameetri masinõpe

Kategooria: