Sissejuhatus Apache PIG-i intervjuu küsimustele ja vastustele

Nii et olete lõpuks leidnud oma unistuste töö Apache PIG-ist, kuid mõtleme, kuidas 2019. aasta Apache PIG-i intervjuud lõhestada ja millised võiksid olla Apache PIG-i intervjuu tõenäolised küsimused. Iga Apache PIG-i intervjuu on erinev ja ka töö ulatus. Seda meeles pidades oleme välja töötanud kõige levinumad Apache PIG-i intervjuu küsimused ja vastused, mis aitavad teil Apache PIG-intervjuus edu saavutada.

Järgnevas loendis on 2019. aasta Apache PIG-i intervjuu küsimused, mida enamasti küsitakse

1. Millised on peamised erinevused MapReduce'i ja Apache Pig'i vahel?

Vastus:
Järgnevalt on toodud peamised erinevused Apache Pig'i ja MapReduce'i vahel, mille tõttu Apache Pig pildile jõudis:
• MapReduce on madala tasemega andmetöötlusmudel, samas kui Apache Pig on kõrgetasemeline andmevoo platvorm
• Ilma keeruliste Java-rakenduste kirjutamiseta MapReduce'is saavad programmeerijad seadet Pig Latin kasutades hõlpsasti samade rakendustega saavutada.
• Apache Pig pakub pesastatud andmetüüpe nagu kotid, tuplid ja kaardid, kuna need puuduvad MapReduce'ist.
• Siga toetab paljude sisseehitatud operaatoritega selliseid andmeoperatsioone nagu filtrid, liitumised, tellimine, sortimine jne. Sama funktsiooni täitmine MapReduce'is on aga tohutu ülesanne.

2. Selgitage MapReduce'i kasutamist sigadel.

Vastus:
Apache Pig'i programmid on kirjutatud päringkeeles, mida nimetatakse Pig Latin, mis sarnaneb SQL päringute keelega. Päringu täitmiseks on vaja käivitusmootorit. Ja Pigimootor teisendab päringud MapReduce'i töödeks ja seega toimib MapReduce täitmismootorina ning on vajalik programmide käitamiseks.

3. Selgitage sea kasutamist.

Vastus:
Saame Siga kasutada kolmes kategoorias, need on:
• ETL-i andmetorujuhe: see aitab asustada meie andmelao. Siga saab andmeid edastada välisesse rakendusse, ta ootab, kuni see on valmis, nii et ta on saanud töödeldud andmed, ja jätkub sealt. See on Siga kõige tavalisem kasutusjuhtum.
• Töötlemata andmete uurimine.
• Iteratiivne töötlemine.

4. Võrrelge Apache Pig'i ja SQL-i.

Vastus:
• Apache Pig erineb SQL-ist selle kasutamisel ETL-i jaoks, laiskhindamisel, andmete säilitamisel torujuhtme mis tahes ajahetkel, torujuhtme lõhede toetamise ja täitmiskavade selgesõnalise deklareerimise osas. SQL (struktuuriline päringute keel) on orienteeritud päringutele, mis annavad ühe tulemuse. SQL-il pole sisseehitatud mehhanismi andmetöötlusvoo tükeldamiseks ja erinevate operaatorite rakendamiseks igasse alamvoogu.
• Apache Pig lubab kasutajakoodi sisestamist valmisoleku mis tahes punkti, samas kui SQL, kus andmeid kasutatakse, tuleb kõigepealt andmebaasi importida ning seejärel algab puhastus- ja teisendusprotsess.

5. Selgitage erinevate keeruliste andmetüüpide kohta Siga.

Vastus:
Apache Pig toetab kolme keerulist andmetüüpi-
• Kaardid - need on peamised väärtusehoidlad, mis on ühendatud numbriga #.
Näide: ('city' # 'pune', 'pin' # 411045) • Tuples - Just sarnane tabeli reaga, kus erinevad üksused eraldatakse komaga. Tuplitel võib olla mitu atribuuti.
• Kotid - järjestamata juppide kogu. Kott võimaldab mitu eksemplaris eksemplari.
Näide: (('Mumbai', 022), ('New Delhi', 011), ('Kolkata', 44))

6. Selgitage erinevaid seadmes saadaval olevaid täitmismudeleid.

Vastus:
Kolm erinevat täitmisrežiimi, mis Pigil saadaval on,
• Interaktiivne või gruntrežiim.
Interaktiivne režiim või grunt mode: Siga interaktiivset kesta tuntakse kui grunt shell. Kui seadmes pole ühtegi faili käitamiseks määratud, käivitatakse see.
• Partii režiim või skripti režiim.
Pig täidab skriptifailis määratud käsud.
• Manustatud režiim
Saame manustada Pig-programme Java-sse ja käivitada Java-programme.

7. Selgitage sigade skripti täitmisplaane (loogiline ja füüsiline plaan)

Vastus:
Loogilised ja füüsilised plaanid luuakse sea skripti täitmise ajal. Sigade skriptid põhinevad tõlgi kontrollimisel. Loogiline plaan saadakse semantilise kontrollimise ja põhilise parsimise teel ning loogilise plaani loomise ajal andmetöötlust ei toimu. Pigi skripti iga rea ​​jaoks tehakse operaatoritele süntaksikontroll ja luuakse loogiline plaan. Kui skriptis ilmneb tõrge, visatakse erand välja ja programmi täitmine lõpeb, vastasel juhul on igal skripti avaldusel oma loogiline plaan.
Loogiline plaan sisaldab skriptis operaatorite kogumit, kuid ei sisalda operaatorite vahelisi servi.
Pärast loogilise plaani genereerimist liigub skripti täitmine füüsilisse plaani, kus on füüsiliste operaatorite kirjeldus, mida Apache Pig kasutab Pigi skripti täitmiseks. Füüsiline plaan sarnaneb enam-vähem MapReduce'i tööde seeriale, kuid sel juhul puudub plaanil viide selle kohta, kuidas seda MapReduce'is täidetakse. Füüsilise plaani koostamise ajal teisendatakse rühmgrupi loogiline operaator kolmeks füüsiliseks operaatoriks, nimelt - lokaalne ümberkorraldamine, globaalne ümberkorraldamine ja pakett. Laadimise ja salvestamise funktsioonid lahendatakse tavaliselt füüsilises plaanis.

8. Milliseid silumisriistu kasutatakse Apache Pigi skriptide jaoks?

Vastus:
Kirjeldage ja selgitage Apache Pig'i olulisi silumisutiliite.
• Selgita utiliit on Hadoopi arendajatele abiks vea silumisel või PigLatini skriptide optimeerimisel. seletamist saab rakendada skripti kindlale pseudonüümile või seda saab kasutada kogu skripti korral grunt interaktiivses kestas. Selgituse utiliit loob mitu graafilist tekstivormingut, mida saab faili printida.
• Kirjelda silumisutiliiti on arendajatele abiks Pig-skriptide kirjutamisel, kuna see näitab skripti seose skeemi. Algajatele, kes soovivad õppida Apache Pig'i, saab kirjeldusutiliidi abil mõista, kuidas iga operaator andmeid muudab. Sigade skriptil võib olla mitu kirjeldust.

9. Millised on mõned Apache Pig'i kasutamise juhtumid, millest võite mõelda?

Vastus:
• Apache Pig suurandmete tööriista kasutatakse eriti iteratiivseks töötlemiseks, töötlemata andmete uurimiseks ja traditsiooniliste ETL-i andmejuhtmete jaoks. Kuna siga saab töötada olukorras, kus skeem pole teada, ebajärjekindel või puudulik - seda kasutavad laialdaselt teadlased, kes soovivad andmeid enne puhastamist ja andmehoidlasse laadimist ära kasutada.
• Näiteks käitumise ennustamise mudelite loomiseks saab veebisait seda kasutada, et jälgida külastajate reageerimist eri tüüpi reklaamidele, piltidele, artiklitele jne.

10. Tõstke esile sigade rühma- ja Cogroup-operaatorite erinevus.

Vastus:
Mõlemad operaatorid saavad töötada ühe või mitme suhtega. Grupi ja Cogroupi operaatorid on identsed. Grupi operaator kogub kõik kirjed sama võtmega. Cogroup on grupi ja liitumise kombinatsioon, see on grupi üldistamine selle asemel, et ühe sisendi kirjete kogumine sõltub võtmest, see kogub n sisendi kirjeid võtme põhjal. Korraga saame rühmitada kuni 127 suhet.

Soovitatavad artiklid

See on olnud juhend Apache PIG-i intervjuu küsimuste ja vastuste loendisse, et kandidaat saaks neid Apache PIG-i intervjuu küsimusi hõlpsalt lahendada. See artikkel sisaldab kõiki kasulikke Apache PIG-i intervjuu küsimusi ja vastuseid, mis aitavad teil intervjuus osaleda. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -

  1. Apache Pig vs Apache Taru
  2. 10 parimat karmi intervjuu küsimust
  3. 8 tõhusat sammu siseintervjuu ettevalmistamiseks
  4. Olulised näpunäited paneeliintervjuu elluviimiseks (kasulik)