Sissejuhatus tarusse Intervjuu küsimused ja vastused

Uuel andmeajastul on taru avatud lähtekoodiga petabaitide skaalaga ETL ja andmelaoinfrastruktuuri tööriistakomplekt struktureeritud ja struktureerimata andmete salvestamiseks, tuginedes hajutatud failisüsteemile (HDFS)
tohutu mahu andmekomplektide analüüsimiseks, päringute tegemiseks ja kaevandamiseks, võimaldades SQL-i tüüpi keelt nimega HiveQL (HQL) ja hõlpsa päringu täitmise, kavandades Hadoop MapReduce.

Taru on Hadoopi peal üles ehitatud suurandmete töötlemiseks ja analüüsimiseks ning see teeb päringute tegemise lihtsaks.
Taru lõi algselt Facebook, hiljem täiustas seda edasi ja arendas seda avatud lähtekoodina Apache Software Foundation ning nimetas seda Apache Hive'iks. Praegu on palju ettevõtteid, kes kasutavad Apache Hive'i oma Big Data lahenduste jaoks.

Kui otsite tööd, mis on seotud Taruga, peate valmistuma 2018. aasta Taru intervjuu küsimustele. Kuigi iga intervjuu on erinev ja ka töö maht on erinev, saame teid aidata 2018. aasta parimate taruvestluste küsimuste ja vastuste osas, mis aitavad teil hüppe teha ja teie intervjuus edu saavutada.

Allpool on loetelu tarude intervjuu küsimustest, mida enamasti küsitakse intervjuus. Need küsimused jagunevad järgmisteks osadeks:

1. osa - taruvestluse küsimused (põhilised)

See esimene osa hõlmab taruvestluse põhiküsimusi ja vastuseid.

1. Loetlege taru arhitektuuri erinevad komponendid?

Vastus:
Taru arhitektuuris on viis põhikomponenti, mis on loetletud allpool:
• Kasutajaliides (UI): see toimib suhtlejana kasutajate ja draiverite vahel, kui kasutaja kirjutab päringuid, mille kasutajaliides võtab vastu ja käivitab draiveris. Saadaval on kahte tüüpi liideseid: käsurida ja GUI-liides.
• Draiver: see hoiab HiveQL päringu olelustsüklit. Ta võtab kasutajaliideselt vastu päringuid ja loob päringu töötlemiseks seansi.
• Kompilaator: see võtab draiverilt päringukavad vastu ja saab plaani täitmiseks vajaliku teabe Metastoreilt.
• Metastore: see salvestab teabe andmete kohta nagu tabel; see võib olla sisemine või väline tabel. See saadab metaandmete teabe koostajale päringu täitmiseks.
• Käivita mootor: tarude teenus viib tulemuse täitmismootorisse; see täidab andmete töötlemiseks päringu MapReduce'is. Ta vastutab kõigi nende komponentide iga etapi juhtimise eest.

2. Milliseid erinevaid režiime Hive töötab?

Vastus:
See on tavaline intervjuus küsitav taruintervjuu küsimus. Taru võib andmete suuruse põhjal töötada kahel režiimil,
Need režiimid on:
• Kaardi vähendamise režiim
•Kohalik režiim

3. Millistes stsenaariumides saab taru kasutada ja mida mitte?

Vastus :
Andmelaorakenduste loomisel, kui teie andmed on staatilised, kui teie rakendus ei vaja suurt reageerimise aega, kui andmemaht on tohutu, kui andmed ei muutu kiiresti ja kui kasutate skriptimise asemel päringuid. Taru toetab ainult OLAP-i tehingut, see ei sobi OLTP-tehingute jaoks.

Liigume järgmiste taruvestluse küsimuste juurde.

4. Milliseid failivorminguid Hive toetab? Loetlege rakenduste tüübid, mida HIVE toetab?

Vastus:
Vaikimisi toetab Hive tekstifaili vormingut ja binaarset failivormingut, näiteks jadafail, ORC-failid, parkettfailid, Avro-andmefailid.
• Järjestusfail: Üldiselt on see binaarses vormingus fail, mida saab tihendada ja jaotada.
• ORC-fail: optimeeritud reasambafail on salvestatud veerupõhine ja veerupõhine salvestusfail.
• Parkettfail: see on veerupõhine binaarfail, mis on suure tõhususega suuremahuliste päringute jaoks.
• Avro andmefail: see on sama nagu jadafaili vorming, mis on jagatav, kokkusurutav ja ridadele orienteeritud fail.
Tarus on lubatud stringi andmetüübi maksimaalne suurus 2 GB.

Hive on andmelao raamistik, mis sobib nendele rakendustele, mis on kirjutatud Java, C ++, PHP, Python või Ruby keeles.

5. Millised on erinevat tüüpi tabelid, mis Hive'is saadaval on?

Vastus:
Taru rakenduses on kahte tüüpi tabeleid:
• Hallatud tabelid: andmed ja skeem kontrollivad taru.
• Välised tabelid: Taru kontrollib ainult skeem.

2. osa - taruvestluse küsimused (täpsemad)

Vaadakem nüüd üksikasjalikke taruvestluse küsimusi.

6. Mis on tarus Metastore? Loetlege ja selgitage erinevat tüüpi Hive Metastores konfiguratsiooni?

Vastus:
Metastore in Hive kasutatakse metaandmete teabe salvestamiseks, see on Hive'i keskne hoidla. See võimaldab metaandmete teavet salvestada välisesse andmebaasi. Vaikimisi salvestab Hive metaandmete teabe Derby andmebaasis, kuid seda saab salvestada ka teistes andmebaasides nagu Oracle, MySql jne.
Metastore'i konfiguratsiooni on kolme tüüpi:
• Manustatud metastore: see on vaikimisi režiim; sellega saab taru lokaalselt juurde pääseda, kõik käsuridade toimingud tehakse manustatud režiimis. Taru teenus, metastore teenus ja andmebaas töötavad samas JVM-is.
• Kohalik metastore: see salvestab andmeid välisesse andmebaasi, näiteks MySql või Oracle. Taru ja metastore teenus töötab samas JVM-is, see loob ühenduse andmebaasiga, mis töötab eraldi JVM-is.
• Kaug-metastore: see kasutab kaugrežiimi päringute käivitamiseks, siin töötab metastore-teenus ja taruteenus eraldi JVM-is. Kättesaadavuse suurendamiseks võib teil olla mitu metastore-serverit.

7. Mis on taru päringu töötleja? Millised on taru päringute töötleja erinevad komponendid?

Vastus:
See on intervjuus sageli küsitav taruintervjuu küsimus. Taru päringuprotsessorit kasutatakse SQL-i teisendamiseks MapReduce-töödeks. Lähtuvalt sõltuvuste järjekorrast töö teostatakse.
Taru päringuprotsessori komponendid on loetletud allpool:
• Semantiline analüsaator
• UDF ja UDAF
• Optimeerija
• Operaator
• Parser
• Täitemootor
• Tüübi kontrollimine
• Loogilise plaani koostamine
• Füüsilise plaani koostamine

8. Milline on Taru Objektiinspektori funktsionaalsus?

Vastus:
See koosneb tarust, mida kasutatakse üksikute veergude struktuuri ja reaobjektide sisestruktuuri tuvastamiseks. Mitmes vormingus salvestatud keerukatele objektidele pääseb ligi tarus asuva objektiinspektori abil.
Objektiinspektor tuvastab objekti struktuuri ja võimalused objekti sisemistele väljadele pääsemiseks.

Liigume järgmiste taruvestluse küsimuste juurde.

9. Millised on erinevad võimalused rakenduste Hive Serveriga ühendamiseks?

Vastus:
Rakenduste taru serveriga ühendamiseks on kolm viisi:
• Thrift Client: seda kasutatakse kõigi tarukäskude käitamiseks erinevat programmeerimiskeelt kasutades, näiteks Java, C ++, PHP, Python või Ruby.
• ODBC draiver: see toetab ODBC protokolli
• JDBC draiver: see toetab JDBC protokolli

10. Mis on taru vaikimisi lugemise ja kirjutamise tunnid?

Vastus:
Allpool on Tarus saadaval olevad lugemis- ja kirjutamiskursused:
• TextInputFormat - seda klassi kasutatakse andmete lugemiseks lihttekstina.
• HiveIgnoreKeyTextOutputFormat - seda klassi kasutatakse andmete kirjutamiseks lihttekstina.
• SequenceFileInputFormat - seda klassi kasutatakse andmete lugemiseks Hadoop Sequence failivormingus.
• SequenceFileOutputFormat - seda klassi kasutatakse andmete kirjutamiseks Hadoop Sequence failivormingus.

Soovitatav artikkel

See on olnud juhend taruvestluse küsimuste ja vastuste loendisse, et kandidaat saaks hõlpsasti nende taruvestluse küsimuste lahendamiseks. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -

  1. 5 parimat DBA-ga seotud intervjuu küsimust ja vastust
  2. 12 kõige vingemat GitHubi intervjuu küsimust ja vastust
  3. 15 kõige olulisemat rubiinintervjuu küsimust ja vastust
  4. Kümme parimat kõige kasulikumat HBase'i intervjuu küsimust