Sissejuhatus juhendatud õppesse

Juhendatud õpe on masinõppe valdkond, kus me töötame väärtuste ennustamisel märgistatud andmekogumite abil. Märgistatud sisendkomplekte nimetatakse sõltumatuks muutujaks, ennustatud tulemusi aga sõltuvaks muutujaks, kuna need sõltuvad tulemuste sõltumatust muutujast. Näiteks on meil kõigil e-posti kontol (nt Gmaili jaoks) rämpsposti kaust, mis tuvastab automaatselt suurema osa teie rämpsposti / pettuste e-kirjadest täpsusega üle 95%. See põhineb juhendatud õppemudelil, kus meil on koolituskomplekt märgistatud andmeid, mis antud juhul on kasutajate märgistatud rämpsposti e-kirjad. Neid koolituskomplekte kasutatakse õppimiseks, mida hiljem kasutatakse uute e-kirjade rämpspostiks liigitamiseks, kui see kategooriale sobib.

Töö juhendatud masinõppe kallal

Mõistagem näite abil juhendatud masinõpet. Ütleme, et meil on puuviljakorv, mis on täidetud erinevate puuviljaliikidega. Meie ülesanne on puuviljad kategoriseerida nende kategooria järgi.

Meie puhul oleme kaalunud nelja tüüpi puuvilju, nendeks on õun, banaan, viinamarjad ja apelsinid.

Nüüd proovime mainida nende puuviljade mõnda ainulaadset omadust, mis muudab need ainulaadseteks.

S Ei

Suurus Värv Kuju

Eesnimi

1

Väike Roheline Ümar kuni ovaalne, kobara kuju silindriline

Viinamarja

2

Suur Punane Ümar kuju, ülaosaga süvend

Apple

3

Suur Kollane Pikk kõver silinder

Banaan

4 Suur Oranž Ümar kuju

Oranž

Ütleme nüüd, et olete puuviljakorvist vilja korjanud, uurisite selle omadusi, näiteks selle kuju, suurust ja värvi, ja järeldasite, et selle puuvilja värvus on punane, kui see on suur, kuju on ümardatud kujuga, ülaosas depressioon, seega õun.

  • Samamoodi teete sama ka kõigi teiste allesjäänud puuviljadega.
  • Parempoolseimat veergu (“Vilja nimi”) tuntakse vastusmuutujana.
  • Nii sõnastame juhendatud õppemudeli, nüüd on kõigil uutel (ütleme robotil või välismaalastel), kellel on antud omadused, üsna lihtne sama tüüpi puuvilju hõlpsalt grupeerida.

Juhendatud masinõppe algoritmi tüübid

Vaatame erinevat tüüpi masinõppe algoritme:

Regressioon:

Regressiooni kasutatakse ühe väärtuse väljundi prognoosimiseks treeningandmete komplekti abil. Väljundi väärtust nimetatakse alati sõltuvaks muutujaks, samas kui sisendeid nimetatakse sõltumatuks muutujaks. Meil on näiteks juhendatud õppes erinevat tüüpi regressiooni,

  • Lineaarne regressioon - siin on meil ainult üks sõltumatu muutuja, mida kasutatakse väljundi ennustamiseks, st sõltuv muutuja.
  • Mitu regressiooni - siin on meil rohkem kui üks sõltumatu muutuja, mida kasutatakse väljundi, st sõltuva muutuja ennustamiseks.
  • Polünoomne regressioon - siin järgneb sõltuvate ja sõltumatute muutujate vaheline graaf polünoomi funktsioonile. Näiteks alguses suureneb mälu vanusega, siis jõuab see teatud vanuseni ja siis hakkab vananedes vähenema.

Klassifikatsioon:

Juhendatud õppealgoritmide klassifikatsiooni kasutatakse sarnaste objektide rühmitamiseks ainulaadsetesse klassidesse.

  • Binaarne klassifikatsioon - kui algoritm üritab grupeerida 2 erinevat klassirühma, siis nimetatakse seda binaarseks klassifikatsiooniks.
  • Mitmeklassiline klassifikatsioon - kui algoritm üritab rühmitada objekte rohkem kui 2 rühma, siis nimetatakse seda multiklasside klassifikatsiooniks.
  • Tugevus - klassifitseerimise algoritmid toimivad tavaliselt väga hästi.
  • Puudused - kalduvad ületalitlusele ja võivad olla piiramatud. Näide - e-posti rämpsposti klassifikaator
  • Logistiline regressioon / klassifikatsioon - kui Y muutuja on binaarne kategooriline (st 0 või 1), kasutame ennustamiseks logistilist regressiooni. Näide - ennustamine, kas antud krediitkaarditehing on petlik või mitte.
  • Naiivsed Bayesi klassifikaatorid - Naiivsete Bayeside klassifikaator põhineb Bayesise teoreemil. See algoritm sobib tavaliselt kõige paremini siis, kui sisendite mõõtmed on suured. See koosneb atsüklilistest graafikutest, millel on üks vanem ja palju lapsi. Lapsõlmed on üksteisest sõltumatud.
  • Otsustuspuud - otsustuspuu on puu diagrammisarnane struktuur, mis koosneb sisemisest sõlmest (omaduse test), harust, mis tähistab testi tulemust, ja lehe sõlmedest, mis tähistab klasside jaotust. Juursõlm on kõige kõrgem sõlm. See on klassifitseerimisel väga laialdaselt kasutatav tehnika.
  • Tugivektorimasin - tugivektorimasin on või SVM klassifitseerib töö, leides hüpertasandi, mis peaks maksimeerima kahe klassi vahelise varu. Need SVM-masinad on ühendatud kerneli funktsioonidega. Valdkonnad, kus SVM-e kasutatakse laialdaselt, on biomeetria, mustrituvastus jne.

Eelised

Allpool on mõned juhendatud masinõppe mudelite eelised:

  1. Mudelite jõudlust saab kasutajakogemuste abil optimeerida.
  2. Juhendatud õpe loob väljundeid, kasutades eelnevat kogemust, ning võimaldab ka andmeid koguda.
  3. Juhendatud masinõppe algoritme saab kasutada rea ​​reaalainete probleemide rakendamiseks.

Puudused

Juhendatud õppe puudused on järgmised:

  • Juhendatud masinõppe mudelite koolitamine võib võtta palju aega, kui andmekogum on suurem.
  • Suurandmete liigitamine on mõnikord suurem väljakutse.
  • Võib juhtuda, et tuleb tegeleda ületalitluse probleemidega.
  • Vajame palju häid näiteid, kui tahame, et mudel klassifikaatori koolituse ajal hästi toimiks.

Head tavad õppemudelite loomisel

See on hea tava juhendatud õppemasina mudelite loomisel: -

  1. Enne hea masinõppe mudeli loomist tuleb läbi viia andmete eeltöötlusprotsess.
  2. Tuleb otsustada, milline algoritm peaks antud probleemi jaoks kõige paremini sobima.
  3. Peame otsustama, millist tüüpi andmeid treeningkomplekti jaoks kasutatakse.
  4. Vaja on otsustada algoritmi ja funktsiooni ülesehituse üle.

Järeldus

Oma artiklis oleme õppinud, mis on juhendatud õpe, ja nägime, et siin koolitame mudelit sildistatud andmete abil. Seejärel asusime õppima modellide ja nende eri tüüpide töösse. Lõpuks nägime nende juhendatud masinõppe algoritmide eeliseid ja puudusi.

Soovitatavad artiklid

See on juhend sellest, mis on juhendatud õpe ?. Siin käsitleme juhendatud õppe mõisteid, selle toimimist, liike, eeliseid ja puudusi. Lisateavet leiate ka meie muudest soovitatud artiklitest -

  1. Mis on sügav õppimine
  2. Juhendatud õpe vs sügav õpe
  3. Mis on Java sünkroonimine?
  4. Mis on veebimajutus?
  5. Eelistega otsustuspuu loomise viisid
  6. Polünoomne regressioon | Kasutused ja funktsioonid

Kategooria: