HDFS vs HBase - kumb on parem (infograafika)

Erinevus HDFS ja HBase vahel

HDFS (Hadoopi hajutatud failisüsteem) HDFS võimaldab salvestada tohutul hulgal andmeid hajutatud ja üleliigsel viisil, mis töötab kauba riistvara peal. HBase (Hadoopi andmebaas) on NoSQL andmebaas, mis töötab teie Hadoopi klastri peal

Vaatame vastavalt HDFSi ja HBase komponente ja arhitektuuri:

HDFS-i komponendid

NameNode
DataNode

NameNode: NameNode-d võib pidada süsteemi ülemaks. See hooldab kõigi süsteemis olevate failide ja kataloogide failisüsteemi puud ja metaandmeid. Metaandmete teabe salvestamiseks kasutatakse kahte faili - nimeruumi pilt ja redigeerimise logi. Namenode omab teadmisi kõigist antud faili andmeplokke sisaldavatest andmesõlmedest, kuid ei salvesta püsivalt plokkide asukohti. See teave rekonstrueeritakse süsteemi käivitamisel iga kord andmetesõlmedest.

DataNode: DataNodes on orjad, kes asuvad klastris igas masinas ja pakuvad tegelikku salvestusruumi. See vastutab klientide taotluste teenindamise, lugemise ja kirjutamise eest.

HDFS arhitektuur: -

HBase komponendid: -

Hbase meister
Piirkonna server
Piirkond
Loomaaiatalitaja

HMaster : see on HBase-i arhitektuuri peaserver. Kogu regiooniserveri jälgimiseks on jälgimisagent ja HMasteri kohustus on olla kõigi metaandmete muudatuste liides. See töötab saidil NameNode.

Regioonide serverid: kui regiooniserver võtab vastu kliendi päringuid ja loeb neid, määrab ta päringu konkreetsele piirkonnale, kus asub tegelik veerupere. Klient saab aga otse piirkonna serveritega kontakti, HMasteri jaoks ei ole piirkonnaserveritega suhtlemiseks vaja HMasteri kohustuslikku luba. Klient nõuab metaandmete ja skeemi muudatustega seotud toimingute tegemiseks HMasteri abi.

Piirkonnad: Regioonid on HBase klastri põhielemendid, mis koosneb tabelite jaotusest ja koosneb veergude perekondadest. See sisaldab mitut poodi, üks iga veerupere kohta. See koosneb peamiselt kahest komponendist, milleks on Memstore ja Hfile.

ZooKeeper: Hbase'is on Zookeeper tsentraliseeritud seireserver, mis hoiab konfiguratsiooniteavet ja pakub hajutatud sünkroonimist. Hajutatud sünkroonimine on juurdepääs klastris töötavatele hajutatud rakendustele, mille ülesanne on pakkuda sõlmedevahelisi koordineerimisteenuseid. Kui klient soovib suhelda piirkondadega, peab serveri klient kõigepealt pöörduma ZooKeeperi poole.

HBase'i arhitektuur: - HBase on osa Hadoopi ökosüsteemist.

Sügavuspõhine mudel: -

HDFS-i ja HBase-i võrdlus ühest otsast teise (infograafika)

Allpool on 14 parimat HDFS-i ja HBase-i võrdlust

Peamised erinevused HDFS ja HBase vahel

Allpool on erinevus HDFS ja HBase vahel järgmised

HDFS on hajutatud failisüsteem, mis sobib hästi suurte failide hoidmiseks. Kuid teiselt poolt on HBase üles ehitatud HDFS-i peale ja see pakub kiireid rekordilisi otsinguid (ja värskendusi) suurte tabelite jaoks.
HDFS põhineb GFS-failisüsteemil. Kuid HBase on levitatud - kasutab HDFS-i ladustamiseks, veerg - orienteeritud, mitmemõõtmelist (versioonid) ja salvestussüsteemi
HDFS kasutab HIVE-i ühe komponendina päringkeele jaoks, mis on HIVE Query Language (HQL), kuid Hbase EI OLE SQL-andmebaas, mis tähendab: - pole liitumisi, pole päringumootorit, andmetüüpe, pole (neetud) SQL-i, skeemi pole ja DBA pole vaja.
Kuna HDFS on hajutatud salvestusüksus, ei oma seepärast muud konkreetset keelt peale kasutatavate käskude, nagu näiteks UNIX-i maitse: - Hadoop dfs -mkdir / foodir
hadoop dfs -cat /foodir/myfile.txt
hadoop dfs -rm /foodir/myfile.txt

Kuid teisest küljest on Hbase'il oma liides Hbase Shelli kujul, näiteks:

hbase (peamine): 003: 0> looge 'test', 'cf'

0 rida 1, 2200 sekundiga

hbase (peamine): 004: 0> pane 'test', 'rida 1', 'vrd: a', 'väärtus1'

0 rida 0, 0560 sekundiga

hbase (peamine): 005: 0> pane 'test', 'rida 2', 'vrd: b', 'väärtus2'

0 rida 0, 0370 sekundiga

hbase (peamine): 006: 0> pane 'test', 'rida3', 'vrd: c', 'väärtus3'

0 rida 0, 0450 sekundiga

hbase (peamine): 007: 0> skaneeri 'test'

Rida VEERUM + KELL

1. rea veerg = vrd: a, ajatempel = 1288380727188, väärtus = väärtus1

2. rea veerg = vrd: b, ajatempel = 1288380738440, väärtus = väärtus2

3. rea veerg = vrd: c, ajatempel = 1288380747365, väärtus = väärtus3

3 rida 0, 0590 sekundiga

HDFS vs HBase võrdlustabel

Võrdluse alus	HDFS	HBase
Miks me neid vajame?	Vaja on töödelda tohutuid andmekogumeid suurtes klastrites arvutites	HBase on hajutatud veerupõhine andmehoidla, mis on üles ehitatud HDFS-i peale
Sõlmed ebaõnnestuvad iga päev	a) Ebaõnnestumine on pigem oodata b) klastris olevate sõlmede arv ei ole konstantne	HBase on Apache avatud lähtekoodiga projekt, mille eesmärk on pakkuda Hadoopi hajutatud arvutisalvestusruumi
Kirjutage muster	Ainult lisa	Juhuslik kirjutamine, mahu suurendamine
Loe mustrit	Täislaua skannimine, partitsioonitabeli skannimine	Juhuslik lugemine, väikese ulatuse või tabeli skannimine
W / R muster	HDFS sobib ideaalselt ühekordseks kirjutamiseks ja mitu korda lugemiseks	HBase sobib ideaalselt HDFS-is salvestatud andmete juhuslikuks kirjutamiseks ja lugemiseks.
Taru (SQL) jõudlus	Suhteliselt väga hea	4-5 korda aeglasemalt
Struktureeritud salvestusruum	Tehke seda ise või TSV või järjestuste fail	Hõreda veeru perekonna andmemudel
Andmete maksimaalne suurus	Tavaliselt saab kauplustes hoida umbes 30 PB	Ligikaudu 1 PB
Dünaamilised muudatused	HDFS-il on jäik arhitektuur, mis muudatusi ei luba. See ei hõlbusta dünaamilist salvestamist.	HBase võimaldab dünaamilisi muudatusi ja seda saab kasutada iseseisvate rakenduste jaoks.
Andmete levitamine	Andmeid hoitakse jaotatult klastri sõlmedes. Andmed jagatakse plokkideks ja salvestatakse seejärel HDFS-klastris olevate sõlmede kohale.	Tabelid jaotatakse klastris piirkondade kaudu ning teie andmete kasvades jaotatakse piirkonnad automaatselt ümber
Andmekogu	Kõik andmed salvestatakse väikeste failidena ja kõigi failide tüüpiline suurus on 64 MB (mis uuemas versioonis on 128 MB)	Kõik andmed salvestatakse tabelite, ridade ja veergude kujul
Andmete modelleerimine	HDFS-is kasutame Map Reduce tehnikat, mis jagab failid võtme-väärtuse paaridesse	HBase põhineb Google'i Bigtable mudelil, mis kasutab ka võtme-väärtuse paare
Operatsioonid	Sellel on kõrge latentsusajaga toimingud	Sellel on vähe latentsusaega operatsioone
Juurdepääsetavus	Sellele pääseb peamiselt MR (Map Reduce) tööde kaudu	Sellele pääseb juurde shellikäskluste, Java API, REST, Avro või Thrift kliendi API kaudu

Järeldus - HDFS vs HBase

Üldiselt võib öelda, et nii HDFS-il kui ka HBase-l on omaette suurepärased tehnoloogiad. Mõlemad, nii HDFS kui ka HBase, loodi suurandmete salvestamiseks ning nendele juurdepääsu ja nende arvutamise hõlpsaks muutmiseks. Mõlemad, nii HDFS kui ka HBase, käivad kõrvuti, kuna üks HDFS salvestab andmed, teine HBase paneb andmetesse skeemi, kuidas neid hiljem kliendi kasutamiseks salvestada ja hankida.

Hbase on üks NoSql veerupõhistest hajutatud andmebaasidest, mis on saadaval apache sihtasutuses. HBase annab rohkem jõudlust vähem kirjete hankimiseks kui Hadoop või Hive. Sisendväärtust on väga lihtne otsida, kuna see toetab indekseerimist, tehinguid ja värskendamist.

Saame võrgus reaalajas analüüse teha Hbase abil, mis on integreeritud Hadoopi ökosüsteemiga. Sellel on automaatne ja konfigureeritav andmekogude või tabelite varjestus ja see pakub rahustavaid API-sid MapReduce'i tööde tegemiseks.

Soovitatav artikkel

See on olnud juhend HDFS vs HBase, nende tähenduse, pea võrdluse kohta, peamised erinevused, võrdlustabel ja järeldus. sellel artiklil on HDFSi ja HBase'i vahel kõik kasulikud erinevused. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -

HBase vs Cassandra - kumb on parem (infograafika)
Siit saate teada 7 parimat erinevust Hadoopi ja HBase'i vahel
Apache taru ja Apache HBase 12 parima võrdlus (infograafika)

HDFS vs HBase - kumb on parem (infograafika)

Lang L: none (table-of-contents):

Erinevus HDFS ja HBase vahel

HDFS-i komponendid

HDFS-i ja HBase-i võrdlus ühest otsast teise (infograafika)

Peamised erinevused HDFS ja HBase vahel

HDFS vs HBase võrdlustabel

Järeldus - HDFS vs HBase

Soovitatav artikkel

Goto avaldus C-s - Kuidas goto lause töötab C-s? - Näide

Google Wallet - Kiirmaksete teenuse rakenduse algajad

Mine vs PHP - 5 olulisimat erinevust infograafika osas

Minge vs Ruby - 10 parimat erinevust, mida infograafika abil õppida

Gradiendi suurendamise algoritm - Gradientide suurendamise täielik juhend

3 olulist ERP karjäärivalikut: milline neist sobib teile?

Viska märksõna Java - Kuidas visata märksõna töötab Java? (Näide)

Tekstuur 3Ds Max - Kuidas ühikuid seada ja tekstuuri 3Ds Maxis rakendada?

Keerme elutsükkel Java - Elutsükli erinevad seisundid ja meetodid

Viska vs viskab Java - 5 parimat erinevust, mida peaksite teadma

Ühiku test vs integratsioonitesti - 9 parimat väärtuslikku erinevust, mida peaksite teadma

Töötuse määra valem - Kalkulaator (näited Exceli malliga)

UNIXi administraator - Reguleerimisala - UNIXi rollid ja vastutus

Määramatuse valem - Arvutamine (näited Exceli malliga)

Ühtsuse skriptimine - Sammud Unity Scriptingi loomiseks koos kasutusaladega