Karjäär Hadoopis - sissejuhatus

Hadoop pole suurandmete maailmas pelk raamistik. Sellel on lai ökosüsteem koos sellega seotud tehnoloogiate vihmavarjuga. Samal põhjusel on paljulubav karjäär Hadoopis. Kui teil on Hadoopi põhialustest hästi aru saada, on see Hadoopi suure karjääri alustala.

Haridus karjääriks Hadoopis

Nagu paljud uued andmesidetehnoloogiad, ei nõua Hadoop iseenesest konkreetset haridusalast tausta. Ligikaudu pooled Hadoopi arendajatest on pärit muu kui infotehnoloogia taustast, nagu statistika või füüsika. Seega on selge, et taust ei takista Hadoopi maailma sisenemist, kui olete valmis õppima põhialuseid. Seal on häid veebikursusi, mis hõlmavad Hadoopi - eduCBA kursus on parim näide - master-apache-Hadoop

Lisaks, kui soovite liikuda sügavamale Hadoopi klastrite halduse või andmete modelleerimise valdkonda Hive materjalides, on iga konkreetne teema saadaval veebikursuste ja õpikutena. Enamasti seadistatakse Hadoopi klastrid pilveteenuse pakkujasse nagu AWS või Azure. Nii et saate tutvuda kõigi teie valitud pilvemüüjatega palju. AWS-i Hadoopi teenus kannab nime EMR.

Populaarne spetsialiseerumine hõlmab:

  • Spark - skaleeritav mälusisene andmetöötlusmootor
  • HBase - HDFS-i peal pole SQL-andmebaasi
  • Beam - voogesituse esimese lähenemise andmetöötlus
  • Siga - andmete teisendamise (ETL) skriptimine
  • Taru - andmete ladustamine
  • Mahout, Spark MLlib - skaleeritav masinõpe Hadoopis
  • Apache Drill - SQL-mootor Hadoopis
  • Flume, Sqoop - andmesideteenused
  • Solr & Lucene - otsimine ja indekseerimine

Karjääritee Hadoopis

Vastavalt 2017. aasta virnade ülevoolu uuringu tulemustele on Hadoop juhtiv populaarseim ja armastatuim raamistik suurandmete ruumis (uuringu link). See on võimalik ainult seetõttu, et erineva IT-vaatenurga inimesed leidsid Hadoopile potentsiaalse karjääritee ja soovivad vahetada.

Ükskõik, milline on teie praegune IT-roll, toimub Hadoopi maailmas hõlpsasti kohandatav karjäär. Mõned populaarsed näited -

  • Tarkvaraarendaja (programmeerija) -> Hadoopi andmearendaja, kes tegeleb erinevate Hadoopi abstraktsioonide SDK-dega ja tuletab andmetest väärtust.
  • Andmeanalüütik -> seega valdate SQL-i. Hadoopis on tohutu võimalus töötada selliste SQL-mootoritega nagu Hive või Impala
  • Ärianalüütik -> organisatsioonid, kes üritavad massiliselt kogutud andmeid kasutades kasumlikumaks muutuda, ja ärianalüütiku roll on selles ülioluline.
  • ETL-i arendaja -> Kui töötate traditsioonilise ETL-i arendajana, saate hõlpsalt Hadoop ETL-i üle minna, kasutades selliseid tööriistu nagu Spark.
  • Testijad -> Hadoopi maailmas on testijate järele tohutu nõudlus. Hadoopi põhialuste ja andmete profileerimise mõistmise kaudu saavad kõik testijad selle rolli üle minna.
  • BI / DW elukutsed -> saavad hõlpsalt Hadoop Data arhitektuurilt üle minna modelleerimisele Data.
  • Vanemad IT-spetsialistid -> Valdkonna ja andmemaailma olemasolevate väljakutsete sügava mõistmise kaudu võib vanemprofessionaalist saada konsultante, saades teadmisi Hadoopi püüdmise kohta neid väljakutseid lahendada.
  • Seal on üldised rollid, nagu Data Engineers või Big Data Engineering, kes vastutab lahenduse juurutamise eest enamasti pilveteenuse pakkujate peal. Pilve pakutavate andmekomponentide tundmise omandamisel on see paljutõotav roll.

Tööpositsioonid

Hadoopi ökosüsteem pakub mitmesuguseid karjäärivõimalusi

  • MapReduce Developer - see on põhimõtteliselt Java arendaja roll, kes mõistab ka seda, kuidas Hadoopi süsteemid sisemiselt töötavad. On olemas abstraktsioon nagu taru või siga, kuid endiselt on MapReduce'i töökohad hädavajalike süsteemide jaoks vajalikud. MapReduce'i arendajad mõistavad süsteemi sisse ja välja ning maksavad tõepoolest kõrgeid makse.
  • Hadoopi administraatorid - need on inimesed, kes vastutavad Hadoopi klastri tervise ja töövõime eest. See võib hõlmata tüüpilisi administraatori toiminguid nagu korrapärased süsteemi tervisekontrollid, kuid enamus Hadoopi süsteemi arhitektuuri mõistmiseks vajalikest toimingutest.
  • Devops - uute süsteemikomponentide ja muude arendusega seotud muudatuste juurutamine Hadoopi klastrisse. Selle rolli vastutus on väga erinev ja sõltub organisatsiooni kultuurist.
  • Andmearendaja - andmetöötlus Hadoopi peal. See on üks Hadoopi ökosüsteemi kõige populaarsemaid rolle. Nendele rollidele sobivad kõige paremini SQL-i või analüüsi taustal olevad inimesed. Enamasti töötavad Hadoopi kõrgetasemelised abstraktsioonid nagu taru või siga.
  • Andmeturbe administraator - andmed on kõige väärtuslikum vara ja nende turvalisus on kõige olulisem. Turvaadministraatorid tagavad andmete kaitsmiseks tööstuse tavapärased põhimõtted ja parimad tavad, mille mõistmise piirang on süsteem
  • Data visualizer - käsitlege järgmise põlvkonna visualiseerimisriistu, mis võimaldavad mälu andmete vahemällu salvestamise abil dünaamilist andmete viilimist ja koondamist
  • ETL-i arendaja - saate muuta andmeid andmete kvaliteedi parandamiseks või äriloogika järgi Hadoopi ökosüsteemi tööriistade abil. ETL-protsess võib olla voogesitus või perioodiline.
  • Süsteemiarhitekt - projekteerige suure jõudlusega süsteeme, võttes arvesse andmete saadavust ja vastupidavust kulutasuval viisil. Sõltub suuresti riistvara pakkujast.
  • Andmearhitekt - lisaks tavapärasele andmete loogilisele / füüsilisele kujundusele on andmearhitekti vastutusel ka paljud muud asjad, näiteks veergude kodeerimine, denormaliseerimine, eraldamise kujundamine jne.

    Soovitatavad kursused

    • Online XML- ja Java-koolitus
    • Node.JS kursused
    • Silverlighti koolituskursus
    • Ember.JS programm

Palk

Tarkvaraarendaja keskmine palk USA-s on 90 956 dollarit aastas, samal ajal kui Hadoopi arendaja keskmine palk on palju suurem - 118 234 dollarit aastas (vastavalt tõele.com - tõepoolest.com)

Hadoopi arendaja palgad USA parimates ettevõtetes (viide: really.com)

AppleAastas 147 573 dollarit
Wipro110 553 dollarit aastas
HERO.jobs158 715 dollarit aastas
MBCAA133 422 dollarit aastas
Ventures Unlimited Inc130 000 dollarit aastas
Nityo Infotech Services Pvt. OÜ128 633 dollarit aastas
PÕHJANAEL126 370 dollarit aastas
PRI tehnoloogia121 396 dollarit aastas
NITYO INFOTECH116 909 dollarit aastas
HortonWorks, Inc110 710 dollarit aastas

Karjäärivaade

Hadoopi ökosüsteem on ettevõtte vajaduste muutumisega toimetulekuks palju erinev. Kuna genereeritavate andmete arv kasvab hüppeliselt ja üha enam organisatsioone muutuvad andmepõhiseks, kasvab Hadoopi süsteemi asjakohasus alles.

Mõned märkimisväärsed suundumused:

  • Üleminek pakettöötluselt voogesituse esimesele andmetöötlusviisile, kasutades funktsiooni Spark ja Beam
  • Spark ML abil saab reaalajas andmete jaoks rakendada rohkem reaalajas masinõppe mudelit
  • SQL-mootorid, mis on eraldatud andmesalvest, nagu Presto S3 peal, võimaldavad ajutist analüüsi andmejärve peal.
  • Veeru MPP andmebaasid, näiteks AWS Redshift, võimaldavad kiiret juurdepääsu andmetele

Kuna suurandmete töötlemise põhiaspektiks on tõrketaluvusega hajutatud ja horisontaalselt skaleeritavad süsteemid, mida Hadoop hästi rakendab, jätkab Hadoop juhtiva andmetöötluse ökosüsteemina.

Soovitatav artikkel

See on olnud Hadoopi karjäärijuhend. Siin oleme arutanud sissejuhatust, haridust, karjääriteed Hadoopis, palka ja karjäärivõimalusi Hadoopis. võite lisateabe saamiseks vaadata ka järgmist artiklit -

  1. Azure Paas vs Iaas ja nende kasulikud eelised
  2. Uurige Java ja Node JS erinevusi
  3. Parim asjatundlik nõuanne suurarvuti karjääri kohta
  4. Karjäär SQL-is
  5. Kasulik karjäär tarkvarainsenerina
  6. Hadoopi administraator | Oskused ja karjääritee

Kategooria: