Mis on juhendatud õpe? - Kuidas see töötab - Tüübid ja eelised

Sissejuhatus juhendatud õppesse

Juhendatud õpe on masinõppe valdkond, kus me töötame väärtuste ennustamisel märgistatud andmekogumite abil. Märgistatud sisendkomplekte nimetatakse sõltumatuks muutujaks, ennustatud tulemusi aga sõltuvaks muutujaks, kuna need sõltuvad tulemuste sõltumatust muutujast. Näiteks on meil kõigil e-posti kontol (nt Gmaili jaoks) rämpsposti kaust, mis tuvastab automaatselt suurema osa teie rämpsposti / pettuste e-kirjadest täpsusega üle 95%. See põhineb juhendatud õppemudelil, kus meil on koolituskomplekt märgistatud andmeid, mis antud juhul on kasutajate märgistatud rämpsposti e-kirjad. Neid koolituskomplekte kasutatakse õppimiseks, mida hiljem kasutatakse uute e-kirjade rämpspostiks liigitamiseks, kui see kategooriale sobib.

Töö juhendatud masinõppe kallal

Mõistagem näite abil juhendatud masinõpet. Ütleme, et meil on puuviljakorv, mis on täidetud erinevate puuviljaliikidega. Meie ülesanne on puuviljad kategoriseerida nende kategooria järgi.

Meie puhul oleme kaalunud nelja tüüpi puuvilju, nendeks on õun, banaan, viinamarjad ja apelsinid.

Nüüd proovime mainida nende puuviljade mõnda ainulaadset omadust, mis muudab need ainulaadseteks.

S Ei	Suurus	Värv	Kuju	Eesnimi
1	Väike	Roheline	Ümar kuni ovaalne, kobara kuju silindriline	Viinamarja
2	Suur	Punane	Ümar kuju, ülaosaga süvend	Apple
3	Suur	Kollane	Pikk kõver silinder	Banaan
4	Suur	Oranž	Ümar kuju	Oranž

Ütleme nüüd, et olete puuviljakorvist vilja korjanud, uurisite selle omadusi, näiteks selle kuju, suurust ja värvi, ja järeldasite, et selle puuvilja värvus on punane, kui see on suur, kuju on ümardatud kujuga, ülaosas depressioon, seega õun.

Samamoodi teete sama ka kõigi teiste allesjäänud puuviljadega.
Parempoolseimat veergu (“Vilja nimi”) tuntakse vastusmuutujana.
Nii sõnastame juhendatud õppemudeli, nüüd on kõigil uutel (ütleme robotil või välismaalastel), kellel on antud omadused, üsna lihtne sama tüüpi puuvilju hõlpsalt grupeerida.

Juhendatud masinõppe algoritmi tüübid

Vaatame erinevat tüüpi masinõppe algoritme:

Regressioon:

Regressiooni kasutatakse ühe väärtuse väljundi prognoosimiseks treeningandmete komplekti abil. Väljundi väärtust nimetatakse alati sõltuvaks muutujaks, samas kui sisendeid nimetatakse sõltumatuks muutujaks. Meil on näiteks juhendatud õppes erinevat tüüpi regressiooni,

Lineaarne regressioon - siin on meil ainult üks sõltumatu muutuja, mida kasutatakse väljundi ennustamiseks, st sõltuv muutuja.
Mitu regressiooni - siin on meil rohkem kui üks sõltumatu muutuja, mida kasutatakse väljundi, st sõltuva muutuja ennustamiseks.
Polünoomne regressioon - siin järgneb sõltuvate ja sõltumatute muutujate vaheline graaf polünoomi funktsioonile. Näiteks alguses suureneb mälu vanusega, siis jõuab see teatud vanuseni ja siis hakkab vananedes vähenema.

Klassifikatsioon:

Juhendatud õppealgoritmide klassifikatsiooni kasutatakse sarnaste objektide rühmitamiseks ainulaadsetesse klassidesse.

Binaarne klassifikatsioon - kui algoritm üritab grupeerida 2 erinevat klassirühma, siis nimetatakse seda binaarseks klassifikatsiooniks.
Mitmeklassiline klassifikatsioon - kui algoritm üritab rühmitada objekte rohkem kui 2 rühma, siis nimetatakse seda multiklasside klassifikatsiooniks.
Tugevus - klassifitseerimise algoritmid toimivad tavaliselt väga hästi.
Puudused - kalduvad ületalitlusele ja võivad olla piiramatud. Näide - e-posti rämpsposti klassifikaator
Logistiline regressioon / klassifikatsioon - kui Y muutuja on binaarne kategooriline (st 0 või 1), kasutame ennustamiseks logistilist regressiooni. Näide - ennustamine, kas antud krediitkaarditehing on petlik või mitte.
Naiivsed Bayesi klassifikaatorid - Naiivsete Bayeside klassifikaator põhineb Bayesise teoreemil. See algoritm sobib tavaliselt kõige paremini siis, kui sisendite mõõtmed on suured. See koosneb atsüklilistest graafikutest, millel on üks vanem ja palju lapsi. Lapsõlmed on üksteisest sõltumatud.
Otsustuspuud - otsustuspuu on puu diagrammisarnane struktuur, mis koosneb sisemisest sõlmest (omaduse test), harust, mis tähistab testi tulemust, ja lehe sõlmedest, mis tähistab klasside jaotust. Juursõlm on kõige kõrgem sõlm. See on klassifitseerimisel väga laialdaselt kasutatav tehnika.
Tugivektorimasin - tugivektorimasin on või SVM klassifitseerib töö, leides hüpertasandi, mis peaks maksimeerima kahe klassi vahelise varu. Need SVM-masinad on ühendatud kerneli funktsioonidega. Valdkonnad, kus SVM-e kasutatakse laialdaselt, on biomeetria, mustrituvastus jne.

Eelised

Allpool on mõned juhendatud masinõppe mudelite eelised:

Mudelite jõudlust saab kasutajakogemuste abil optimeerida.
Juhendatud õpe loob väljundeid, kasutades eelnevat kogemust, ning võimaldab ka andmeid koguda.
Juhendatud masinõppe algoritme saab kasutada rea reaalainete probleemide rakendamiseks.

Puudused

Juhendatud õppe puudused on järgmised:

Juhendatud masinõppe mudelite koolitamine võib võtta palju aega, kui andmekogum on suurem.
Suurandmete liigitamine on mõnikord suurem väljakutse.
Võib juhtuda, et tuleb tegeleda ületalitluse probleemidega.
Vajame palju häid näiteid, kui tahame, et mudel klassifikaatori koolituse ajal hästi toimiks.

Head tavad õppemudelite loomisel

See on hea tava juhendatud õppemasina mudelite loomisel: -

Enne hea masinõppe mudeli loomist tuleb läbi viia andmete eeltöötlusprotsess.
Tuleb otsustada, milline algoritm peaks antud probleemi jaoks kõige paremini sobima.
Peame otsustama, millist tüüpi andmeid treeningkomplekti jaoks kasutatakse.
Vaja on otsustada algoritmi ja funktsiooni ülesehituse üle.

Järeldus

Oma artiklis oleme õppinud, mis on juhendatud õpe, ja nägime, et siin koolitame mudelit sildistatud andmete abil. Seejärel asusime õppima modellide ja nende eri tüüpide töösse. Lõpuks nägime nende juhendatud masinõppe algoritmide eeliseid ja puudusi.

Soovitatavad artiklid

See on juhend sellest, mis on juhendatud õpe ?. Siin käsitleme juhendatud õppe mõisteid, selle toimimist, liike, eeliseid ja puudusi. Lisateavet leiate ka meie muudest soovitatud artiklitest -

Mis on sügav õppimine
Juhendatud õpe vs sügav õpe
Mis on Java sünkroonimine?
Mis on veebimajutus?
Eelistega otsustuspuu loomise viisid
Polünoomne regressioon | Kasutused ja funktsioonid

Mis on juhendatud õpe? - Kuidas see töötab - Tüübid ja eelised

Lang L: none (table-of-contents):

Sissejuhatus juhendatud õppesse

Töö juhendatud masinõppe kallal

Juhendatud masinõppe algoritmi tüübid

Regressioon:

Klassifikatsioon:

Eelised

Puudused

Head tavad õppemudelite loomisel

Järeldus

Soovitatavad artiklid

Mis on esiotsa arendaja? - Juhend rollide, oskuste ja karjäärikasvu kohta

Mis on FreeBSD? - Siit saate teada FreeBSD eeliseid ja puudusi

Mis on funktsionaalne testimine? - Funktsionaalse testimise omadused ja tüübid

Mis on hägune loogika? - Kuidas see töötab - Arhitektuur ja rakendus

Mis on geneetiline algoritm? - Geneetilise algoritmi faasid ja rakendused

VBA sõnaraamat - Sammud sõnaraamatu loomiseks Excelis VBA

VBA üritused - Kuidas kasutada funktsiooni DoEvents rakenduses Excel VBA?

VBA hämar - Kuidas kasutada Excel VBA Dim'i? (Näited)

VBA Do Loop - Kuidas kasutada Excelis Do Loopi VBA-koodi abil?

VBA kustuta rida - Kuidas kustutada rida Excel VBA-s?

Matlabi käsud - Käskude põhiloend

Maatriksi korrutamine Java-s - Üldine metoodika - Näited

Maveni intervjuu küsimused ja vastused - Üles ja enim küsitud

Maven vs Ant - 34 parimat erinevust, mida infograafikaga õppida

Maya kiirklahvid - Maja jaoks olulised kiirklahvid