Sissejuhatus juhendamata masinõppesse

Kas olete kunagi mõelnud, kuidas laps suudab õunu ja apelsine eristada, kui ta ei tea, mis need tegelikult on, kuidas need maitsevad, kuid värvi ja suuruse põhjal saab ta jagada ilma eelneva teabeta kahte rühma? Kas värvi ja suuruse kohta käiva teabe põhjal võib oodata sama segmenteerimist, mida laps teeb masinatest? Vaatame, kuidas seda teha! Selles teemas tutvume juhendamata masinõppega.

Mõiste „masinõpe” kohaselt õpetame me masinaid tegema inimesesarnaseid ülesandeid ja seda, kuidas inimesed õpivad, kas kelleltki või vaatluse teel. Sama, mis inimestel, on ka masina õppimisviis.

Masinõpe võib jagada kolmeks osaks: -

  1. Juhendatud õppimine
  2. Juhendamata õppimine
  3. Tugevdusõpe

Masinõppe tüübid

Tugevdusõpe on agendipõhine õpe, mis hõlmab tasu ja karistust agendi tehtud toimingute eest. Lõpp-eesmärk on maksimeerida üldist kasu keskkonnast õppimise protsessis.

Kui teil on sisendandmeid-väljundandmeid, võib lühidalt tähistada näiteks andmeid pikkuse ja kaalu kohta, et teha kindlaks, kas inimene on mees või naine, võib seda pidada juhendatud õppeülesandeks (inimeste puhul kellegi käest).

Kuid paljudes tõsielustsenaariumides pole need märgistatud või märkustega andmed alati saadaval. Mitu korda seisame silmitsi probleemidega objektide segmentimisel nende omaduste põhjal, mida pole selgesõnaliselt mainitud. Kuidas seda probleemi lahendada? Noh, juhendamata õpe on lahendus.

Vikipeedia ütleb, et juhendamata õpe on teatud tüüpi iseorganiseeritud heebiakeelne õpe, mis aitab leida varem tundmatuid mudeleid andmekogumis ilma olemasolevate siltideta. Juhendamata õppe korral pole meil teavet sildi kohta, kuid siiski soovime saada andmeid nende erinevate omaduste põhjal.

Juhendamata masinõppe tüübid

Juhendamata õppeülesanded võib jagada laias laastus kolme kategooriasse:

  1. Ühingureeglite kaevandamine
  2. Klastrid
  3. Soovitussüsteem

1. Ühingureeglite kaevandamine

Kui meil on millegi kohta tehinguandmeid, siis võib see olla müüdud toodete kohta või mis tahes tehinguandmed selle kohta, ma tahan teada, kas ostja ja toodete või toodete vahel on mingit varjatud seost, nii et saan seda teavet kuidagi kasutada müügi suurendamiseks. Nende suhete kaevandamine on Association Rule Miningi tuum. Suhete eraldamiseks saame kasutada AIS, SETM, Apriori, FP kasvu algoritme.

2. klastrid

Rühmitada saab mis tahes andmeid, kui meil pole klassi ega sildi teavet. Tahame andmed rühmitada nii, et sarnaste omadustega vaatlused kuuluksid samasse klastrisse / rühma ja klastritevaheline kaugus peaks olema maksimaalne. Klastrisisene vahemaa peaks olema minimaalne. Saame rühmitada valija andmed, et teada saada valitsuse arvamust või klastritooteid nende omaduste ja kasutuse põhjal. Jaotage elanikkond vastavalt sissetulekuomadustele või kasutage rühmitust müügis ja turunduses.

Saame kasutada K-vahendeid, K-vahendeid ++, K-medoide, hägusaid C-vahendeid (FCM),

Ootus-maksimeerimine (EM), aglomeratiivne klasterdamine, DBSCAN, hierarhilise rühmituse tüübid üheainsa seosena, täielik seostamine, mediaalne seotus, Wardi meetodite algoritmid klastrimiseks.

3. Soovitussüsteem

Soovitussüsteem on põhimõtteliselt assotsieerimisreeglite laiendamine selles mõttes, et ARM-is võtame välja suhteid ja soovitustesüsteemis kasutame neid suhteid, et soovitada midagi, mille lõppkasutaja on suurema aktsepteerimisvõimalusega. Soovitussüsteemid on populaarsust kogunud pärast seda, kui Netflix kuulutas 2009. aastal välja peaauhinna - 1 000 000 USA dollarit.

Soovitussüsteemid põhinevad tehinguandmetel, olgu selleks finantstehingud, e-poe või toidupoe tehingud. Tänapäeval meelitavad e-kaubanduse hiiglaslikud mängijad kliente, pakkudes igale kasutajale kohandatud soovitusi, mis põhinevad nende varasemal ostuajalool ja samalaadsetel andmetel teiste kasutajate ostuandmetel.

Soovitussüsteemide väljatöötamise meetodid võib üldjoontes jagada ühiseks filtreerimiseks ja sisupõhiseks filtreerimiseks. Ühises filtreerimises on jällegi kasutajate-kasutajate ühised filtreerimised ja üksuste-üksuste ühised filtrid, mis on mälupõhised lähenemised ning maatriksi faktoriseerimine ja singulaarse väärtuse lagundamine (SVD) on mudelipõhised lähenemisviisid.

Juhendamata õppe rakendused

Kuna maailma andmed kasvavad tohutult iga päevaga, on juhendamata õppimisel palju rakendusi. Loome andmeid alati YouTube'is sotsiaalse meedia platvormide või mõne videosisu abil ja sageli ei tee me seda isegi tahtlikult. Kõik need andmed on struktureerimata ja nende märgistamine juhendatud õppeülesannete jaoks on väsitav ja kallis.

Järgnevalt on toodud mõned juhendamata masinõppe lahedad rakendused.

  1. Toidupood või e-poe pood / turg: väljavõtete ühingu reeglid klientide tehinguandmete kohta ja soovitused tarbijatele toodete ostmiseks.
  2. Sotsiaalmeedia platvorm: saate suhete loomise erinevate kasutajatega, et soovitada tooteid või teenuseid. Soovitage uusi inimesi sotsiaalse ühenduse loomiseks.
  3. Teenused: reisiteenuste soovitused, majade üürimis- või matšiteenuste soovitused.
  4. Pangandus: klastri kliendid nende finantstehingute põhjal. Klastri petlik tehing pettuste tuvastamiseks.
  5. Poliitika: klastri valijate arvamused konkreetse partei võiduvõimaluste kohta.
  6. Andmete visualiseerimine: Klasterdamise ja t-jaotunud stohhastiliste naabrite manustamise (t-SNE) abil saame visualiseerida suure mõõtmega andmeid. Seda saab kasutada ka mõõtmete vähendamiseks.
  7. Meelelahutus: soovitused filmidele, muusikale, nagu teevad Netflix ja Amazon.
  8. Kujutise segmenteerimine: klastripiltide osad lähimate piksliväärtuste põhjal.
  9. Sisu: isikupärastatud ajalehed, veebilehtede soovitused, e-õppe rakendused ja e-posti filtrid.
  10. Struktuuriline avastus: rühmitamise abil võime avastada andmetes igasuguse varjatud struktuuri.Klastri twitteri andmed sentimentide analüüsiks.

Järeldus

Juhendamata masinõpe pole liiga kvantifitseeritav, kuid võib lahendada paljusid probleeme, mille puhul juhendatud algoritmid ebaõnnestuvad. Mitmes valdkonnas, kus meil on struktureerimata ja sildistamata andmeid, on juhendamata õppe jaoks palju rakendusi. Me võime kasutada juhendamata õppe tehnikaid, et õpetada oma masinaid tegema meist paremat tööd. Viimastel aastatel on masinad edestanud inimesi nende ülesannete osas, mida inimesed peavad sajandeid lahendatuks. Loodan, et selle artikli abil saite aru, mis on ja kuidas saab juhendamata masinõppe tehnikaid kasutada reaalse maailma probleemide lahendamiseks.

Soovitatavad artiklid

See on juhendamata masinõppe juhend. Siin käsitleme masinõppe tüüpe ja juhendamata masinõppe tüüpe koos selle rakendustega. Võite lisateabe saamiseks vaadata ka järgmisi artikleid -

  1. Masinõppe algoritmid
  2. Mis on masinõpe?
  3. Sissejuhatus masinõppesse
  4. Masinõppe tööriistad
  5. Klastrid masinõppes
  6. Hüperparameetri masinõpe
  7. Hierarhiline klasterdamisalgoritm
  8. Hierarhiline rühmitus | Aglomeratiivne ja lõhestav klasterdamine
  9. Masinõppe elutsükli 8 parimat etappi

Kategooria: