Ülevaade andmeteadlasele vajalikest oskustest

2012. aastal väitis Harvardi ettevõtte ülevaade, et „andmeteadlane on 21. sajandi seksikaim töö“. Kui soovite eelnevalt teada, millised on vajalikud oskused andmeteadlaseks saamiseks, siis vaatame, mida andmeteadlane teeb. Andmeteadlase määratlemiseks on palju viise, kuid lihtsuse huvides öelgem seda nii, et andmeteadlane on keegi, kes suudab ammutada tähendusi ja saada andmetest väärtuslikku teavet. Andmeteadlase töö hõlmab peamiselt andmete kogumist, puhastamist ja manipuleerimist.

Tehnilised ja mittetehnilised oskused

Nüüd sukeldugem tehnilistesse ja mittetehnilistesse oskustesse, mis on vajalikud andmeteadlaseks saamiseks.

Tehnilised oskused

Andmeteadlaseks saamiseks vajalikud tehnilised oskused on toodud allpool.

1. Suure hulga andmetega toimetuleku võime

Loodud andmete hulk on viimastest aastatest alates plahvatuslikult kasvanud ja enamik neist on liigitatud struktureerimata andmete hulka. Struktureerimata andmetele viidatakse tavaliselt andmetele, mis ei asu traditsioonilises reaveergude andmebaasis, mis on täpselt vastupidine struktureeritud andmetele, vaid mõned struktureerimata andmete näidetest on videod, fotod ja helisõnumid. Kuna andmeteadlase peamine roll on andmete tähenduse eraldamine, peaks olema mugav suures koguses andmeid käsitleda, olenemata nende olemusest, kas need on struktureeritud või struktureerimata.

2. Andmete visualiseerimine

Ettevõttes genereeritavad andmed tuleb otsuste tegemiseks tõlkida lihtsasti mõistetavasse vormingusse. Andmeteadlasena peab inimene suutma andmeid visualiseerida selliste tööriistade abil nagu Tableau, Plotly, Visual.ly, D3.js ja Power BI. Samuti on oluline, et andmeteadlane oleks kursis andmete visuaalse koondamise põhimõtetega. See on andmeteadlase üks olulisi rolle, kuna andmete visualiseerimine on ettevõtete ainus valik toimingute jaoks, mis töötavad andmetega otse.

3. Statistika

Statistika roll andmeteaduses on väga oluline. Andmeteadlaste jaoks on statistika matemaatiline distsipliin, mis annab vajalikud tööriistad ja meetodid mustrite leidmiseks ja annab keerukatest andmetest ülevaate, teostades sellel matemaatilisi arvutusi. Kuna andmeteadlase roll on tähenduste eraldamine andmete mustrite tuvastamise kaudu, on statistikaalane teadmine andmeteadlase põhioskuseks.

4. Programmeerimisoskused

20 aastat tagasi genereeritud andmemahu korral piisab Excelist sellega tegelemiseks, kuid struktureeritud ja struktureerimata andmete hulgaga, mis tänapäevaseid andmeid genereerib, peaks teadlastel olema teadmisi programmeerimisriistade nagu Python, R, SQL kui

  • Need annavad rohkem võimalusi koolitada andmekogumit paljude statistiliste meetoditega
  • Need parandavad andmete analüüsi ajal protsessi tõhusust

5. Andmete manipuleerimine

Enamikul juhtudel on vajaminevad andmed räpane ja andmeteadlastel on seda tüüpi andmetega keeruline töötada. Nii et pärast andmete saamist järvedest on esimene samm nende puudustega tegelemine. Mõned puudused hõlmavad puuduvaid väärtusi, ebaregulaarseid stringe, nagu näiteks Los Angeles LA, kuupäeva vorming nagu 10/09/2009 ja 2009/09/10. Kõik need puudused tuleb enne väljaõppe või andmete analüüsi alustamist sorteerida.

6. Mitme muutujaga kalkulatsioon ja lineaarne algebra

Maatriksite (lineaarne algebra) ja diferentseerumise (Calculus) mõistete mõistmine on oluline oskus, mida andmeteadlasel peaks olema. Organisatsioonis, kus selle olemasolevad andmed mängivad olulist rolli tulevikuprognooside tegemisel, võivad ennustava jõudluse väikesed parandused või algoritmiline optimeerimine organisatsiooni jaoks palju muuta. Andmeteadlase algstaadiumis eelkooditud mudelite kasutamisel ei pea olema maatriksite või arvutuspõhimõtete põhjalikku tundmist, kuid kindlasti on vaja mõista mudeleid või varjundeid, mis toimub mudelite kapoti all või ehitada välja oma rakendused nende mõistete mõistmiseks.

Mittetehnilised oskused

Andmeteadlaseks saamiseks vajalikud mittetehnilised oskused on toodud allpool.

1. Intellektuaalne uudishimu

Enamikul juhtudel ei näe keegi organisatsiooni andmeid analüüsides otseseid tulemusi ega vastuseid. Mida rohkem on küsimusi, mida hakkate endale esitama, seda rohkem on vastuseid, mille saate andmetest välja mõelda. Üldiselt on uudishimu määratletud kui tugev soov millestki aru saada. See on põhjus, miks intellektuaalne uudishimu on andmeteadlase väga oluline omadus.

2. Tugev ettevõtlusoskus

Ilma organisatsiooni andmete või ärimudeli elementide mõistmiseta ei saa kõik tehnilised oskused, mis andmeteadlasel olemas on, organisatsiooni jaoks vajalikke tulemusi saada, sest ta ei saa aru, millised andmestikus sisalduvad omadused tuleks eelistada ja mida tuleks pidada viimaseks. Nii et andmeteadlase jaoks aitab organisatsiooni ärimudeli ja andmete mõistmine lahendada selle võimalikke väljakutseid, et nende äri säilitada ja kasvatada.

3. Tugevad suhtlemisoskused

Andmeteadlasena tuleks ette valmistada esitlus nende tehniliste avastuste kohta ja esitada see mittetehnilistele meeskondadele, nagu näiteks müügiosakonnad, mingil ajal karjääris. Andmeteadlasena peaksid olema sellised oskused nagu jutuvestmine (oskus juttude põhjal lugusid jutustada), sest kogu aeg ja energia, mis kulub andmete uurimisele, statistiliste võtete rakendamisele, tulemuste väljaselgitamisele ja muule, kulub asjata kui andmeteadlane ei suuda sõnumeid ettevõtte juhtidele õigesti edastada. Ja enamikul juhtudest pole ettevõtete juhid huvitatud kõigi järelduste tegemiseks võetud sammude kuulamisest, keskendutakse peamiselt tulemustele ja esitatud väärtustele. Nii et lugu on alati terav ja mõistlik, on see alati parim tava.

Järeldus - andmeteadlasele vajalikud oskused

Need on mõned kõige olulisemad oskused, mis inimesel peaksid olema andmeteadlasena töötamiseks, kuna nende peamine töö hõlmab organisatsiooni andmetega töötamist, nende analüüsimist ja esitlemist ettevõtte juhtidele.

Soovitatavad artiklid

See on juhend andmeteadlasele nõutavate oskuste jaoks. Siin käsitleme tehnilisi ja mittetehnilisi oskusi, mis on vajalikud andmeteadlaseks saamiseks. Lisateavet leiate ka meie muudest soovitatud artiklitest -

  1. Andmeteaduse karjäär
  2. Andmeteaduse keeled
  3. Big Data Analytics palk
  4. Andmeanalüütiku intervjuu küsimused
  5. PHP muutmise kuupäeva vorming

Kategooria: