Sissejuhatus Hbase'i intervjuu küsimustele ja vastustele

HBase on populaarne veerupõhine NoSQL andmebaasihaldussüsteem, mis töötab Hadoopi hajutatud failisüsteemi (HDFS) peal. See sobib hästi hõredate andmekogumite jaoks, mis on levinud paljudel suurandmete kasutamise juhtudel.

Siin on kümme kõige rohkem küsitud 2019. aasta HBase'i intervjuu küsimust ja vastust: nii et olete lõpuks leidnud oma unistuste töökoha HBase'is, kuid mõtlete, kuidas Hbase'i intervjuu lõhestada ja millised võiksid olla 2019. aasta Hbase'i intervjuu tõenäolised küsimused. Iga vestlus on erinev ja ka töö ulatus. Seda meeles pidades oleme välja töötanud kõige tavalisemad Hbase'i intervjuu küsimused ja vastused, mis aitavad teil intervjuus edu saavutada. Need küsimused jagunevad järgmisteks osadeks:

1. osa - HBase'i intervjuu küsimused (põhilised)

See esimene osa hõlmab põhilisi HBase'i intervjuu küsimusi ja vastuseid.

1. Millal peaksite HBase'i kasutama?

Vastus:
Hbase ei sobi kõigi kasutusjuhtude jaoks. Parima sobiva stsenaariumi saab tuvastada järgmiste kontrollidega -
i.Data maht: Peaks olema hajutatud keskkonnas töödeldavate andmete petabaite.
ii.Rakendus: HBase ei sobi OLTP (veebitehingute töötlemise) süsteemide jaoks, mis nõuavad keerulisi mitme avaldusega tehinguid. Samuti puudub kompleksne SQL-i tugi, mida on vaja relatsioonianalüütika jaoks. Eelistatav on see, kui teil on tohutul hulgal andmeid veidi erinev skeem.
iii.Klastri riistvara: HBase töötab HDFS peal. Ja HDFS töötab tõhusalt suure hulga sõlmedega (vähemalt 5). Niisiis saab HBase olla hea valik ainult hea riistvaratugi korral.
iv.Nel traditsiooniline RDBMS: Hbase ei toeta ühtegi kasutusjuhtu, mis nõuab tavapäraseid funktsioone, nagu Mitme tabeli liitumine, komplekssed SQls pestud või aknafunktsioonid jne.
v.Kiire juhuslik juurdepääs andmetele: kui vajate juhuslikku ja reaalajas juurdepääsu oma andmetele, siis on HBase sobiv kandidaat. See sobib suurepäraselt ka suurte struktureeritud andmetega tabelite hoidmiseks.

2. Mis vahe on Cassandra ja HBase vahel?

Vastus:
Nii HBase kui ka Cassandra on levitanud Hadoopi ökosüsteemist pärit suurandmete NoSQL andmebaasi. Mõlemad on ehitatud erinevateks kasutusjuhtudeks.
HBase'il on omamoodi ülem-alluv arhitektuur, mis koosneb mitmest komponendist, nagu loomapidaja, Namenode, HBase Master (Hmaster) ja andmesõlmed. Cassandra kohtleb kõiki sõlme meistrina, mis tähendab, et kõik sõlmed on võrdsed ja täidavad kõiki funktsioone.
HBase on optimeeritud lugemiseks, kirjutamine toimub ainult peasõlmega ja sellel on pärast kirjutamist lugemiseks tugev järjepidevus. Kui valitud on järjepidevus, on Cassandral suurepärane üherealine lugemisjõudlus.
Hbase ei toeta loomulikult sekundaarseid indekseid, Cassandra toetab sekundaarseid indekseid veeruperedes, kus veeru nimi on teada.
Algselt luuakse Hbase Google'is ja nad panid selle nimeks BigTable. Isegi praegu ühilduvad Bigtable'i ja HBase'i API-liidesed. Cassandra on pärit DynamoDB-st, mis on AWS-i NoSQL-andmebaas.

Liigume järgmiste HBase'i intervjuu küsimuste juurde.

3. Mis on Hbase peamised komponendid?

Vastus:
HBase a-l on kolm olulist komponenti - HMaster, Region Server ja ZooKeeper.
i.HBase Master - HBase tabelid on jagatud piirkondadeks. Kuigi käivitamisel otsustab Master, millise piirkonna millisele regiooniserverile määrata (piirkonna serverist saab klastri sõlme). Samuti tegeleb ta tabeli metaandmete toimingutega, näiteks skeemi loomine või muutmine. See komponent mängib olulist rolli ka rikete taastamisel
ii. Regiooniserver - nagu eespool mainitud, toimub siin tegelike andmete kirjutamine ja lugemine. Need on tegelikud klastri sõlmed. Selles on paljude tabelite piirkondi, mille otsustamiseks alustatakse ja lõpetatakse rea klahvid. Tüüpiline piirkonna server võib teenindada kuni tuhat piirkonda
iii.ZooKeeper - ZooKeeper on klastrite koordineerimise raamistik, mida kasutatakse laialdaselt Hadoopi ökosüsteemis. Zookeeper jälgib kõiki klastri HMasteri kontaktides olevaid servereid (põhi- ja regiooniservereid) ning kontaktandmeid ZooKeeperiga ja vigade korral antakse teatisi.

4. Mis on HBase Bloom Filter?

Vastus:
See on tavaline HBase'i intervjuu küsimus, mida intervjuus küsitakse. HBase Bloom Filter on tõhus mehhanism, et kontrollida, kas poodifail (kui midagi kirjutatakse HBase'i, kirjutatakse see kõigepealt mälusisesele poodile, kui see mälukaart on teatud suuruse saavutanud, loputatakse see kettale salvestusfaili. ) sisaldab konkreetset rida või veergu lahtrit. Tavaliselt on ainus viis otsustada, kas poodifailis on reavõti, kontrollida faili ploki indeksit, millel on poodifaili iga ploki algusjärgus võti. Bloom-filtrid toimivad mälusisese andmestruktuurina, mis aitab vähendada ketta loendust ainult failidele, mis tõenäoliselt sisaldavad seda rida - mitte kõik failid. Nii et see toimib nagu mälusisene indeks, mis näitab rea leidmise tõenäosust konkreetsest poodifailist.

5. Mis on tihendamine? Selgitage selle erinevaid liike.

Vastus:
HBase salvestab kõik vastuvõetud toimingud oma mäluruumi. Kui mälupuhver on täis, loputatakse see kettale. Kuna see võib HDFS-is luua palju väikeseid faile, saab HBase aeg-ajalt valida failid, mida tihendada suuremaks. Tihendamist nimetatakse väiksemaks, kui HBase valib tihendatava HFiles ainult osa, kuid mitte kõiki. Suurema tihendamise korral valitakse kõik failid kokku tihendamiseks. Suur tihendamine toimib nagu väike, välja arvatud see, et kustutusmarkereid saab eemaldada pärast nende rakendamist kõigile seotud lahtritele ja sama lahtri kõik lisaversioonid ka kukutatakse.

2. osa - HBase'i intervjuu küsimused (täpsemad)

Vaadakem nüüd HBase'i täpsemaid intervjuuküsimusi.

6.Kuidas HBase'i versiooni andmed?

Vastus:
Andmete sisestamisel / värskendamisel / kustutamisel loob HBase selle veeru jaoks uue versiooni. Tegelik kustutamine toimub ainult tihendamise ajal. Kui konkreetne lahter ületas lubatud arvu versioone, siis tihendamise ajal langetatakse lisaversioonid

7. Mis vahe on skannimisel ja skannimisel?

Vastus:
Get tagastab Hbase'i tabelist ainult ühe rea antud võtme alusel. Skaneerimise käsk tagastab ridade komplekti sõltuvalt antud otsingutingimustest. Tavaliselt on skaneerimine kiirem kui skannimine. Seega peaks eelistama seda võimaluse korral kasutada.

Liigume järgmiste HBase'i intervjuu küsimuste juurde.

8. Mis juhtub rea kustutamisel?

Vastus:
Kustutamise ajal käsuandmeid failisüsteemist füüsiliselt ei kustutata, selle asemel tehakse markeri määramisega nähtamatuks. Füüsiline kustutamine toimub tihendamise ajal
Veeru, versiooni ja perekonna kustutamise markerid on kolme erinevat tüüpi markerid, mis tähistavad vastavalt veeru, versiooni versiooni ja veeruperekonna kustutamist.

9. Selgitage erinevust HBase ja Hive vahel.

Vastus:
See on täpsustatud HBase'i intervjuu küsimus, mida küsiti intervjuus. HBase ja Hive on mõlemad täiesti erinevad Hadoopi põhised andmetöötluse tehnoloogiad. Taru on relatsioonilaadne SQL-iga ühilduv hajutatud salvestusraamistik, samas kui HBase on NoSQL-i võtmeväärtusega kauplus. Taru toimib Hadoopi peal koos SQL-iga abstraktsioonikihina. HBase-i andmetele juurdepääsu muster on kahe peamise toimingu - hangi ja skannimine - abil väga piiratud. HBase on ideaalne reaalajas andmetöötluseks, kus Hive on ideaalne valik pakettandmete töötlemiseks.

10. Mis on Hlog ja HFile?

Vastus:
HLog on ettekirjutamise logifail, tuntud ka kui WAL ja HFile on tegelik andmete salvestamise fail. Andmed kirjutatakse kõigepealt eelregistreerimise logifaili ja kirjutatakse ka MemStoreisse. Kui MemStore on täis saanud, loputatakse MemStore'i sisu kettale HFilesisse.

Soovitatav artikkel

See on olnud juhend Hbase'i intervjuu küsimuste ja vastuste loendisse, et kandidaat saaks hõlpsalt neid Hbase'i intervjuu küsimusi lahendada. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -

  1. Kasulikud rühmaintervjuu küsimused
  2. Olulised põhiintervjuude näpunäited
  3. Intervjuu olulised sammud Prep
  4. Intervjuu küsimused, mida finantskandidaadilt küsida