Sissejuhatus masinõppesse

Masinõpe (ML) on algoritmide väljatöötamise kunst ilma selgesõnalise programmeerimiseta. Viimase kahe aastakümne jooksul on andmeid kogutud ekstreemseid andmeid ja enamik tööstusharusid on täielikult digitaliseeritud. Neid olemasolevaid andmeid kasutavad masinõppe (ML) algoritmid ennustavate mudelite väljatöötamiseks ja mitmete aeganõudvate ülesannete automatiseerimiseks.

Vaatame, kuidas erinevad ML-i algoritmid programmeeritud loogikapõhistest algoritmidest:

Loogikal põhineva algoritmi jaoks on voog hästi määratletud ja ette teada, kuid reaalses elus on mitu stsenaariumi (näiteks kujutise klassifikatsioon), kus loogikat pole võimalik määratleda. Sellistel juhtudel on masinõpe osutunud äärmiselt kasulikuks. Masinõppe tehnikad võtavad sisendparameetrid ja eeldatava väljundväärtuse ning genereerivad loogika, mis seejärel rakendatakse tootmisesse.

Masinõppe sissejuhatuse peamised komponendid:

Masinõpe jaguneb järgmisteks kategooriateks:

1. Juhendatud masinõpe

Juhendatud ML-algoritm võtab sisendis andmeid (funktsioone) koos väljundmärgisega andmetega. Neid kasutatakse enamasti klassifitseerimise ja regressiooni ülesanneteks.

Klassifikatsioon:

Laenukõlblikkuse otsus : automatiseerige laenu kinnitamise protsess, kasutades varasemaid andmeid, mille parameetrid on näiteks vanus, sissetulek, haridus, linn jne, et otsustada, kas taotleja laenu saab heaks kiita.

Regressioon:

Majahinna ennustamine: ennustage majahind selliste funktsioonide abil nagu maja suurus, maja vanus, tubade arv, paikkond jne.

2. Juhendamata masinõpe

Järelevalveta ML-tehnikad ei vaja märgistatud andmeid ja neid kasutatakse andmete rühmitamiseks sisendfunktsioonide põhjal erinevatesse segmentidesse.

Näide: 100-liikmelise rühma jagamiseks 5 klastrisse võivad sisestusfunktsioonid hõlmata huvisid, hobisid, sotsiaalseid sidemeid jne.

Masinõppe rakendused

Viimase kümnendi jooksul on masinõppe sissejuhatus muutnud mitmeid tööstusharusid, sealhulgas tervishoidu, sotsiaalmeediat, digitaalset turundust, kinnisvara, logistikat, tarneahelat ja tootmist. Nendes tööstusharudes varased ettevõtjad on juba märkimisväärset kasumit teeninud. Kasvab nõudlus kvalifitseeritud tööjõu järele, kellel oleks masinaõpe koos domeeniteadmistega.

Järgnevalt on toodud mõned rakendused, kus ML-meetoditel on olnud oluline roll:

Rämpsposti klassifikatsioon:

Postide klassifitseerimiseks rämpspostiks / mitte rämpspostiks, kasutades sildistatud vastuseid koos selliste andmete kasutamisega nagu sõnumi sisu, reklaammeilis kasutatava sõnavara kasutamine, saatja e-posti aadress, saatja IP, hüperlinkide kasutamine, numbrimärgid jne.

Vähi tuvastamine:

ML-i kasutatakse tervishoius üha enam diagnoosimisel ja isegi vähktõve tuvastamisel, kasutades varasemate patsientide meditsiinilisi andmeid. Rinnavähi tuvastamiseks võtab treeningalgoritm sisendina selliseid andmeid nagu kasvaja suurus, raadius, kõverus ja ümbermõõt. Väljundis saame tõenäosuse, kas kasvaja on pahaloomuline või mitte.

Müügiprognoos :

Üha suurem arv müüjaid digitaliseerib oma dokumendid, paljud neist on hakanud kasutama masinõppevahendeid, et ennustada konkreetse kauba müüki konkreetsel nädalal, et neil oleks piisav kogus varusid. Sissejuhatus Masinõppe tehnikatesse võetakse sisendid eelmise aasta müügist erinevate esemete jaoks ja leitakse hooajaliste erinevuste mustrid ning antakse konkreetsed prognoosid teatud esemete müümiseks. Samuti võime müügi osas tuvastada madala tootlikkusega objekte.

Näotuvastus:

Tõenäoliselt olete Facebooki pilte üles laadides märganud, et see sildistab teie sõbra nägusid nende nimedele. Taustvas masinas / süvaõppe algoritmid teevad seda tööd. Sama põhimõttelist sissejuhatust masinõppe põhimõtetesse kasutatakse ka näotuvastuses, kus sisestatud näopilte söödetakse ja närvivõrgustikke koolitatakse nende piltide klassifitseerimiseks.

Teksti klassifikatsioon:

Rahvastiku arvu suurenemise tõttu on veebisaidi / sotsiaalmeedia ettevõtetele, nagu Twitter, Facebook, Quora, muutunud kohustuslikuks tekstiklassifitseerimise põhiste süsteemide juurutamine. Twitter / Quora kasutab seda vihkavate kommentaaride / postituste tuvastamiseks. Mõned uudistefirmad kasutavad sarnaste uudiste artiklite rühmitamiseks ka teksti klassifitseerimise algoritme.

Heli / hääle tõlgendamine:

Kunagi imestage, kuidas sellised seadmed nagu Alexa, Siri ja Google muutuvad päevast päeva intelligentseteks, et mõista heliandmeid erinevates keeltes ja erinevate aktsentidega. Nendes seadmetes koolitatakse tohutul hulgal andmeid masinõppe tehnikate tutvustamiseks, mis teeb selle võimalikuks.

Pettuste tuvastamise süsteemid:

Mitmel e-kaubandusega tegeleval ettevõttel on kasutusele võetud ML-põhine pettuste tuvastamise süsteemid, et tuvastada võltsitud tellimusi loovaid kliente ja kõrvaldada ka platvormil võltstooteid müüvad müüjad. Pangandussektor ja muud finantstehnoloogiaga alustavad ettevõtjad tuginevad pettustehingute tuvastamisel suuresti ML-i tehnikatele

Soovitusmootorid

Netflix kasutab filmide soovitamiseks järelevalveta ML-i, Amazon kasutab seda toodete ostmiseks.

Eelised

Automatiseeri aeganõudvaid ülesandeid:

ML-põhised rakendused on automatiseerinud mitmeid ülesandeid, näiteks madala taseme otsustamine, andmesisestus, telefonikõned ja laenu kinnitamise protsessid.

Kulude kokkuhoid:

Kui algoritm on välja töötatud ja kasutusele võetud, võib see põhjustada märkimisväärset kulude kokkuhoidu, kuna inimeste tööjõud ja otsuste tegemine on minimaalsed.

Käivitusaeg:

Paljude rakenduste jaoks on ülitähtis üldaeg. ML on suutnud vähendada aega sellistes domeenides nagu autokindlustuse kahjunõuded, kus kasutaja laadib pilte üles ja kindlustussumma arvutatakse. Samuti on see aidanud e-kaubanduse ettevõtetel müüdud varude tagastamisega toime tulla.

Andmepõhine otsustamine:

Mitte ainult ettevõtted, vaid ka paljud valitsused loodavad ML-ile otsuste tegemisel, millistesse projektidesse investeerida ja kuidas olemasolevaid ressursse optimaalselt kasutada.

Puudused

ML-algoritme saab kallutada:

Paljud ajad on ML-algoritmi sisendandmed kallutatud kindlale soole, rassile, riigile, kastile jne. Selle tulemuseks on ML-algoritmid, mis levitavad soovimatut eelarvamust otsustusprotsessis. Seda on täheldatud mõnes rakenduses, mis juurutas ML-moodi kooli / kolledži vastuvõtuprotsessi ja sotsiaalmeedia soovitusi.

Aktsepteeritava täpsuse saavutamiseks on vaja suuri andmeid:

Kuigi inimesed saavad väikeste andmekogumite abil hõlpsalt õppida, nõuab mõne rakenduse jaoks masinõppe sissejuhatus piisava täpsuse saavutamiseks tohutul hulgal andmeid.

Manipuleeri kasutaja otsust:

Hiljuti kasutas analüütikaettevõte Cambridge Analytica sotsiaalmeedias ML-algoritme, et valijate otsust suunata ja mõjutada.

Praegu võib masinõppe algoritmi sissejuhatus tulevikus hästi sobida:

Praegusel andmestikul treenitav ML-tehnika ei pruugi tulevikus hästi sobida, kuna sisendi jaotus võib aja jooksul oluliselt muutuda. Üks vastumeetme selle ületamiseks on perioodiline mudeli ümberõpe.

Soovitatavad artiklid

See on olnud masinõppe sissejuhatuse juhend. Siin oleme arutanud masinõppimist masinõppe sissejuhatuse põhipunktide ja omadustega. Võite vaadata ka järgmisi artikleid:

Masinõppe tehnikad
Masinõpe vs närvivõrk
Karjäär masinõppes
Erinevus suurandmete ja masinõppe vahel
Hüperparameetri masinõpe

Sissejuhatus masinõppesse - Masinõppe rakendamine

Lang L: none (table-of-contents):