Sissejuhatus tarude käskudesse
Hive-käsk on andmelao infrastruktuuri tööriist, mis asub Hadoopi kohal suurte andmete kokkuvõtmiseks. See töötleb struktureeritud andmeid. See muudab andmete pärimise ja analüüsimise lihtsamaks. Taru käsku nimetatakse ka „lugemise skeemiks“. Taru ei kontrolli andmeid laadimisel, kinnitamine toimub ainult päringu väljastamisel. See taru omadus muudab selle kiire laadimise kiireks. See on nagu faili kopeerimine või lihtsalt teisaldamine ilma piiranguid ja kontrollimisi seadmata. Taru töötas esmakordselt välja Facebook. Apache Tarkvara Sihtasutus võttis selle hiljem kasutusele ja arendas edasi.
Siin on käsu Hive komponendid:
Joonis 1. Taru komponendid
https://www.developer.com/
Siin on allpool loetletud käsu Taru omadused:
- Tarude kauplused on Hadoopis töötlemata ja töödeldud andmestik.
- See on loodud veebipõhiseks tehingute töötlemiseks (OLTP). OLTP on süsteemid, mis hõlbustavad suure hulga andmete edastamist väga vähese ajaga ilma ühe serveri lootuseta.
- See on kiire, skaleeritav ja usaldusväärne.
- Siin pakutavat SQL-tüüpi päringkeelt nimetatakse HiveQLiks või HQL-ks. See muudab ETL-i ülesanded ja muu analüüsi lihtsamaks.
Joonis 2. Taru omadused
Allikate pildid: - Google
Taru käsklusel on ka mõned piirangud, mis on loetletud allpool:
- Taru ei toeta alamsüüdimisi.
- Taru toetab kindlasti ülekirjutamist, kuid kahjuks ei toeta see kustutamist ja värskendusi.
- Taru pole OLTP jaoks mõeldud, kuid seda kasutatakse selleks.
Taru interaktiivse kesta sisestamiseks toimige järgmiselt.
$ HIVE_HOME / prügikast / taru
Tarude põhikäsud
-
Loo
See loob tarus uue andmebaasi.
-
Tilk
Tilk eemaldab laua Tarust
-
Alter
Käsk Alter aitab teil tabeli või tabeli veerud ümbernimetada.
Näiteks:
taru> ALTER TABLE töötaja RENAME TO töötaja1;
-
Näita
Kuva käsk näitab kõiki tarus asuvaid andmebaase.
-
Kirjelda
Käsk Kirjelda aitab teavet tabeli skeemi kohta.
Tarude vahelised käsud
Taru jagab tabeli veergude põhjal erinevalt seotud partitsioonideks. Neid sektsioone kasutades on andmete küsimine lihtsam. Need partitsioonid jagunevad veelgi ämbriteks, et tõhusalt päringuid andmetele käivitada.
Teisisõnu jaotavad ämbrid andmed klastrite komplekti, arvutades päringus mainitud võtme räsikoodi.
-
Partitsiooni lisamine
Partitsiooni lisamise saab teha tabeli muutmisega. Oletagem, et teil on tabel „EMP”, väljadega nagu ID, nimi, palk, osakond, määramine ja yoj.
taru> ALTER TABLE töötaja
> LISA OSAKOHT (aasta = '2012')
asukoht '/ 2012 / part2012';
-
Partitsiooni ümbernimetamine
taru> ALTER TABLE töötajate OSALUS (aasta = '1203')
RENAME PARTITION (Yoj = '1203');
-
Drop vahesein
taru> ALTER TABLE töötaja tilk (kui on)
> OSAKOND (aasta = '1203');
-
Suhteoperaatorid
Suhtekorraldajad koosnevad teatud operaatorite komplektist, mis aitab asjakohast teavet hankida.
Näiteks: öelge, et teie EMP-tabel näeb välja selline:
Teostame taru päringu, mis toob meile töötaja, kelle palk on suurem kui 30000.
taru> VALI * EMP-st, kus palk> = 40000;
-
Aritmeetikaoperaatorid
Need on operaatorid, kes aitavad operandidel aritmeetilisi toiminguid teostada, ja tagastavad omakorda alati numbritüübid.
Näiteks: kahe numbri lisamiseks, näiteks 22 ja 33
taru> SELECT 22 + 33 ADD FROM temp;
-
Loogiline operaator
Need operaatorid peavad teostama loogilisi toiminguid, mis vastutasuks tagastavad alati tõese / vale.
taru> VALI * EMP-st, kus palk> 40000 && Dept = TP;
Tarude täpsemad käsud
-
Vaade
Vaate kontseptsioon tarus on sarnane nagu SQL-is. Vaate saab luua SELECT-avalduse täitmise ajal.
Näide:
taru> CREATE VIEW EMP_30000 AS
VALI * EMP-st
KUS palk> 30000;
-
Andmete laadimine tabelisse
Taru> Laadige tabelisse olekutesse lokaalne sissejuhatus '/home/hduser/Desktop/AllStates.csv';
Siin on „Riigid” tarus juba loodud tabel.
https://www.tutorialspoint.com/hive/
Tarul on mõned sisseehitatud funktsioonid, mis aitavad teil tulemust paremal viisil tuua.
Nagu ümar, põrand, BIGINT jne.
-
Liitu
Liitumisklausel võib aidata sama veeru nime põhjal kahe tabeli ühendamisel.
Näide:
taru> VALI c.ID, c.NAME, c.AGE, o.AMOUNT
KLIENTIDEST c ÜHINENUD TELLIMUSTEGA o
SEES (c.ID = o.CUSTOMER_ID);
Taru toetab igasuguseid liitumisi: Vasak väline liitumine, parem väline liitmine, täielik väline liitumine.
Nõuanded tarude käskude kasutamiseks
Hive muudab andmetöötluse lihtsaks, arusaadavaks ja laiendatavaks, et kasutaja pööraks taru päringute optimeerimisele vähem tähelepanu. Kuid kui taru päringu kirjutamisel tähelepanu pöörata mõnele asjale, toob see kindlasti töökoormuse haldamisel ja raha säästmisel kindlasti suurt edu. Allpool on mõned näpunäited selle kohta:
- Vaheseinad ja kopad: taru on suur andmetööriist, mis saab päringuid teha suurtest andmekogumitest. Päringu kirjutamine domeenist aru saamata võib Hive'is aga suurepäraseid vaheseinu tuua.
Kui kasutaja on andmestikust teadlik, võib vastavad ja laialt kasutatud veerud grupeerida samasse sektsiooni. See aitab päringut kiiremini ja ebatõhusamalt käitada.
Lõppkokkuvõttes ei. Samuti väheneb kaardistaja ja I / O operatsioonide arv.
Joonis 3. Jaotumine
Allikate pildid: Google'i pilt
Joonis 4 Koppimine
Allikate pildid: - Google'i pilt
- Paralleelne täitmine: taru töötab päringut mitmes etapis. Mõnel juhul võivad need etapid sõltuda teistest etappidest, seega ei saa alustada, kui eelmine etapp on lõpule viidud. Üldise tööaja kokkuhoidmiseks võivad iseseisvad ülesanded siiski toimida paralleelselt. Paralleelsõidu lubamine tarus:
sea hive.exec.parallel = true;
Seega suurendab see klastri kasutamist.
- Valimi blokeerimine: tabelist andmete valimine võimaldab uurida andmete päringuid.
Vaatamata koputamisele soovime pigem proovida andmekogumit juhuslikumalt. Plokkide proovivõtmisel on kaasas erinev võimas süntaks, mis aitab andmete valimist mitmel viisil.
Proovivõtteid saab kasutada u. teave andmestikust, näiteks keskmine vahemaa lähte ja sihtkoha vahel.
Kui küsite 1% suurandmetest, saate täpse vastuse. Uurimine muutub lihtsamaks ja tõhusamaks.
Järeldus - tarude käsud
Taru on kõrgema taseme abstraktsioon HDFS-i peal, mis pakub paindlikku päringkeelt. See aitab hõlpsamalt päringuid teha ja andmeid töödelda.
Taru saab oma funktsionaalsuse täieõiguslikuks kasutamiseks koondada teiste suurte andmeelementidega.
Soovitatavad artiklid
See on olnud tarude käskude juhend. Siin oleme arutanud nii taru põhikäske kui ka täiustatud käske ja mõnda vahetut taru käsku. Lisateabe saamiseks võite vaadata ka järgmist artiklit -
- Taru intervjuu küsimused
- Hive VS Hue - 6 parimat kasuliku võrdlust
- Tableau käsud
- Adobe Photoshopi käsud
- Funktsiooni ORDER BY kasutamine tarus
- Laadige taru alla ja installige samm-sammult