Mis on HBase?
HBase on veerupõhine hajutatud andmebaas, mis on loodud töötama hajutatud failisüsteemis nimega HDFS (HDFS - Hadoop Distributed File System). Suurte andmekogumite haldamiseks laias keskkonnas tuleb Hadoop pildile.
HBase määratlus
Hajutatud keskkonnas toetab HBase optimaalselt kõrge tabeli värskenduskiirusi ja ka klastrite horisontaalset skaleerimist. See võimaldab peamiselt andmebaasis tohutuid tabeleid.
Peamine logide salvestamise tehnika on WAL-vormingus logide kasutamine.
Näiteks - HBase on parim struktureeritud andmete töötlemiskeskkond. Facebook on üks suuremaid näiteid, kus ta kasutab sõnumsideplatvormi, mis sisaldab miljardeid ridu ja miljoneid veerge.
Andmete järjepidevus on lugemise / kirjutamise ajal üks olulisi tegureid, HBase annab järjepidevusele tugevat mõju. Iga piirkonna serverite haldamiseks on ennekõike vaja HBase arhitektuuri. HBase on suures osas kodeeritud Java-ga, mille eesmärk oli 2010. aastal Apache'i tipptasemel projekt edasi lükata.
HBase mõistmine
HBase tegeleb automaatselt tõrkesiirde ja koormuse tasakaalustamisega, kasutades piirkonnaserveri replikatsiooni. Samuti võib see hõivata metaandmeid. HBase'is kasutatakse peamiselt Shardingut. Nagu me juba teame, koosneb HBase piirkondadest, kus nad saavad piirkonna serverite toidet ja iga piirkond jagatakse regiooniserverite abil täiesti erinevatel andmesõlmedel. HBase võib tükeldada kas käsitsi või automaatselt.
Klastrite suurendamiseks võime serverite võimsamaks muutmise asemel klastritesse lisada n-arvu masinaid. Ka lennult saame luua mitmekordse arvu klastrid. Kui piirkonna serverisõlm töötab, hakkab klaster iseenesest uuesti tasakaalustuma. HBase'il on ainulaadne omadus salvestada iga veerg eraldi, nagu ükski teine relatsiooniandmebaas, mis salvestub ridade alusel. See toetab ka käsureatööriista abil lihtsalt toiminguid.
Kuidas teeb HBase töötamise nii lihtsaks?
Ainus põhjus on salvestusmehhanismi tõttu. Põhimõtteliselt on HBase segmentideks järjestatud andmebaas. Lisaks on selles olevad tabelid veergude kaupa paigutatud. Laua ülesehitus iseloomustab siin lihtsalt sektsioonide perekondi, mis on võtmeväärtuse komplektid. Sellest hoolimata on mõeldav, et tabelis on erinevad sektsioonide perekonnad ja siin võib igal segmendiperekonnal olla suvaline arv segmente. Lisaks pannakse siin plaadil, mille tulemuseks on sektsioonide hinnangud, külgnevad. Veelgi enam, lisaks on igal tabeli lahtri hinnangul siin ajatempel.
HBase'is viitab tabel veergude kogunemisele. Rida osutab sektsioonide perede kogunemisele. Sektsioonipere viitab segmentide kogunemisele. See osa viitab võtmeisikute komplektide kogunemisele.
Mida saate teha HBase'iga?
Kuigi meil peab olema suurandmetele ebaregulaarne ja pidev lugemine / koostamine, kasutame Apache HBase. On mõeldav, et Apache HBase'iga on erakordselt suured tabelid üksuste varustuse rühmade kohta. Pärast Google'i Bigtable'i on HBase demonstreeritud mittesotsiaalse andmebaasina. Põhimõtteliselt, kuna Bigtable käitub Google'i failisüsteemis valesti, võtab HBase samal viisil Hadoopi ja HDFS-i ülaosas ülesvõtte.
Töö HBase'iga
Oletame, et tabeli kirjed paigutatakse mälulehtedele. Need lehed kantakse olulisse mällu, kui neid pole ametlikult mällu kuvatud. Juhul, kui ühel real on leht ja meil on vaja uurimiseks mingit konkreetset jaotist, näiteks kompensatsiooni või entusiasmi iga rea kohta, peab iga segmenti sisaldav leht mälu omandama; nii et see leht sisse & välja välja toob kaasa palju I / O-d, mis võib viivitada töötlemisajaga.
Jaotises asuvates andmebaasides jaotatakse iga segment lehtedeks. Juhul, kui peame teatud segmendi hankima, jääb vähem sisend / väljundit, kuna lihtsalt eelmääratud segmenti sisaldavad lehed oleks pidanud esmase mälu tooma ja neid lugema ning me ei pea kõiki neid jaotisi tooma ja läbi vaatama. lehed, mis sisaldavad read ja kirjeid edaspidi mällu.
Niisiis teenindab päringute liik, kus peame lihtsalt saama selgesõnalisi segmente, mitte terveid kirjeid või kogumeid, segmendi andmebaasis, mis on väärtuslik uurimiseks, kus saame paar sektsiooni ja teha mõned numbrilised toimingud.
Rakendus
- Raskete rakenduste kirjutamiseks saame kasutada Apache HBase.
- Pealegi, kuigi meil on vaja saada olemasolevatele andmetele kiire juhuslik juurdepääs, kasutame HBase-i.
- Samuti kasutavad mõned ettevõtted HBase'i sisemiselt, näiteks Facebook, Twitter, Yahoo ja Adobe jne.
Eelised
- HBase on töötanud produktiivse ja infosurve abistamisel.
- See toetab teabe kiiret taastamist.
- Organisatsioon ja disain on lahti harutatud. Seda võib väga hästi vähendada ja sellest tulenevalt on kõike muud kui keeruline laiendada.
- See on kasulik eliidile kõigi küsimuste korral (näiteks COUNT, Kokku, AVG, MIN ja MAX).
- See on jaotamiseks produktiivne, kuna see annab programmeeritud varjutusinstrumendile esiletõstmise, et edastada suurem ala väikestele.
Miks peaksime kasutama HBase'i?
- Sellel on täiesti ringlussevõetud tehnika ja see suudab käsitleda hämmastavalt ulatuslikku teavet.
- See töötab uskumatult suvaliselt lugemiseks ja komponeerib tegevusi.
- Sellel on kõrge turvalisus ja teabe lihtne haldamine.
- See annab märkimisväärselt kõrge komponeerimise läbilaskevõime.
- Lisatingimustele vastamise skaleerimine on järjekindel ja reipas.
- Saab kasutada nii organiseeritud kui ka poolorganiseeritud infotüüpide jaoks.
- Tore on siis, kui te ei pea vaevama RDBMS-i täielike võimalustega.
- Sellel on laitmatult mõõdetud ja sirge kohanemisvõime esiletõst.
- Teave on koostatud ja komponeeritud ning on hoolikalt usaldusväärne.
- Laua varjutamist saab tõhusalt korraldada ja automatiseerida.
- Erinevatele serveritele antakse programmeeritud tõrkesiirde tugi.
- MapReduce'i tööhõivet saab toetada HBase-tabelitega.
- klient, kes kasutab, on kooskõlas Java API-dega.
Miks me vajame HBase?
HBase on dünaamiline NoSQL andmebaas, mida nähakse tänapäeval laienedes ja mis on suurandmetega üle koormatud. Sellel on äärmiselt lihtne Java programmeerimisjuur, mida saab saata HBase skaleerimiseks suures mahus. Ärilisi olukordi, kus töötame ainult ebapiisava teabega, on palju, et otsida hunnik teabevälju, mis koordineerivad miljardites nummerdatud teabehalduri konkreetseid kriteeriume. See on väga puudustele tolerantne ja tugev ning suudab käsitleda erinevat tüüpi teavet, muutes selle muutuvas äriolukorras väärtuslikuks.
See on segmentideks paigutatud tabel, mis muudab miljardite teabeväljade hulgast õige teabe otsimise lihtsaks. Saate teabe ilma õige sirvimiseta õigete seadistuste ja automatiseerimisega tabelitesse liigendada. HBase on teabe süstemaatiliseks ettevalmistamiseks täiesti sobiv. Kuna selgitaval ettevalmistamisel on tohutult palju vajalikke andmeid, muudab see järelepärimise ületanud üksildases serveris mõeldava läbimurde. See on koht, kus hajutatud varumine pildile satub.
Samuti on olemas nõue hoolitseda paljude lugemiste ja komponeerimise eest, mis on RDBMS andmebaasi kasutades lihtsalt ebareaalne, seega on HBase selliste rakenduste jaoks ideaalne võimalus. Selle uuenduse lugemis- ja koostamispiiri võib suurendada isegi miljonitesse sekundisse, andes sellele erakordse eelistuse. Facebook kasutab seda laialdaselt rakenduste pidevaks teavitamiseks ja Pinterest kasutab arvukalt ülesandeid, mis teostavad kuni 5 miljonit ülesannet iga sekundi kohta.
Õige vaatajaskond HBase tehnoloogia õppimiseks?
- Tarkvaraarendajad ja suurarvuti spetsialistid.
- Projektijuht, Big Data analüütikud ja testimisspetsialistid.
- Java arendajad, andmehalduse spetsialist.
Ulatus ja karjäärikasv
Nagu me ilmselt teame, on Hadoopi keskkond tõusuteel ja võime öelda, et HBase on ideaalne etapp HDFS-i (Hadoopi hajutatud failisüsteem) ülaosaga tegelemiseks. Hiljem, alates praegusest, on HBase õppimine kasulik arengus. Isegi organisatsioonid otsivad konkurente, kes saaksid HBase'i infomudeleid saata ulatuslikes Hadoopi kimpudena, mis koosnevad tootmisseadmetest. Neist samast küljest aitab selle HBase'i uuenduse õppimine meil täita mõnda ülesannet, näiteks saata dokumendi virnastamiseks laadimisutiliit, kooskõlastada see taruga, saada teavet HBase API ja HBase kesta kohta. Järelikult viib selle õppimine meie elukutse järgmisse dimensiooni.
Järeldus
Pärast HBase õppimist täidate enamasti erinevaid ülesandeid, saadate kirje virnastamiseks laadimisutiliidi, ühendate selle taruga, saate teada HBase API ja HBase kesta kohta. See võib teie elukutsel tohutult aidata oma kutset järgmisesse dimensiooni viia.
Soovitatav artikkel
See on olnud teemaks Mis on HBase? Siin arutasime HBase kontseptsioone, määratlust, tööpõhimõtteid, rakendusi ja eeliseid. Lisateavet leiate ka meie muudest soovitatud artiklitest -
- Mis on andmetöötlus?
- Mis on andmeladu?
- Mis on andmete kaevandamise määratlus?
- Mis on andmeteadus?
- Sammud, mida peate suurarvuti testimisel järgima