Ülevaade AWS RedShiftist
AWS pakub palju funktsioone, mis muudavad meie jaoks asja lihtsamaks. Selles teemas õpime tundma, mis on AWS Redshift ja mõnda AWS Redshift tehnoloogiat, mis on toodud allpool: -
- Amazon EC2
- Amazon RDS
- Amazon S3
- Amazon CloudFront
- Amazoni automaatne skaleerimine
- Amazonase lambda
- Amazoni punanihk
Üks peamisi AWS-i pakutavaid teenuseid, millega me tegeleme, on Amazon RedShift. Mis see RedShift on, milleks seda kasutatakse, need on põhiküsimused, mis tekivad meil alati, kui me seda loeme. nii et vaatame üksikasjalikult, mis on punane nihe ja milleks seda kasutatakse. RedShift on ettevõtte tasemel petabaidide suurusega ja täielikult hallatav andmelaoteenus.
Mis on andmeladu? Vastus päringule omaette jääb, kui me teame, mis ladu on üldmõiste. Üldiselt on ladu koht, kus toormaterjale või tööstuskaupu võib enne nende müüki turustamist ladustada, sama kehtib andmete, samuti andmelao kohta erinevatest allikatest andmete kogumiseks, säilitamiseks ja haldamiseks ning asjakohase ja sisuka ülevaate saamiseks ärist. Nii et Amazon pakub ettevõtte tasemel ladustamisriista, kus saame REDSHIFT abil andmeid töödelda ja hallata. Nende andmekogumite vahemik varieerub 100 gigabaidist petabaidini.
AWS RedShifti kasutamise põhjused
Nii et sageli seisame silmitsi üldise küsimusega, et enne seda AWS-i tööriista, kus see ladu oli, kus me kõik need andmetöötlust, salvestamist ja tootmist tegime. Nii et varem, kui andmekoormus oli üsna normaalne, oli meil füüsilisi servereid, andmebaase, mida kasutati andmete jälgimiseks ja seal töötlemiseks, kuid kuna andmete päringute maht suurenes eksponentsiaalselt ja andmete käsitlemine muutus raskeks ülesandeks, kuna päringud algasid oodatust kaua.
Nii et siin tekkis meil vajadus amazoni punase nihke järele, mis oli andmete salvestamiseks ja tootmiseks väga suure jõudluse ja mastaapsusega väga kiire. See oli tohutu salvestusmahu ja läbipaistva hinnakujundusega ning kaitstud mitmesuguste andmerikkumiste eest. SQL-liideste ja mitmesuguste draiverite ODBC / JDBC toetamine on üsna hõlpsasti kasutatav ja hästi ühendatud teiste Amazoni teenustega.
AWS RedShifti töötamine
Vaatame nüüd Redshifti arhitektuuriskeemi ja proovime mõista, kuidas RedShift tegelikult töötab -
- Järgmine diagramm kujutab Amazon RedShifti tööd. Vaatame seda üksikasjalikult: -
- Kliendirakendusega ühenduse loomiseks on meil mitu draiverit, mis ühendavad Redshiftiga.
- Redshifti raames saame luua mitu klastrit ja iga klaster saab majutada mitut andmebaasi.
- Sõlmed jagunevad viiludeks, kusjuures viilidel on andmed.
- Kui meil on rohkem kui üks sõlm, on olemasolevate sõlmede hulgast valitud Leader, mis on kliendi jaoks peamine suhtlusallikas. Kliendirakendus räägib ainult juhtsõlmega, juhtsõlm vastutab kliendiprogrammist päringute ja käskude vastuvõtmise eest.
- Kui juhtsõlm hakkab kliendi päringuid hankima, hakkab ta päringut parsima ja koostama plaani, et muuta see käitamiseks teistes arvutisõlmedes. Kui protsess on vastavatele sõlmedele jaotatud, ootab see enne Kliendile tagastamist selle sõlmede lõplikku tulemust.
- Saame lisada sõlmede arvu ja suurendada ka mälu, kui andmete koormus suureneb.
- Arvutussõlmedel on eraldi võrk, millele ka kliendil puudub juurdepääs, muutes selle turvaliseks.
- Sõlme on kahte tüüpi: tiheda salvestussõlme ja tiheda arvutuse sõlmed, salvestusmaht võib ulatuda 160 GB kuni 16 TB
Nii nägime siin REDSHIFTi toimimise põhiarhitektuuri. Liigume nüüd selle juurde, kuidas kasutada Aws Redshifti.
AWS RedShifti kasutamine -
AWS Redshiftiga töötamiseks peame tegema mõned allpool nimetatud põhietapid: -
1) Logige sisse AWS-i ja tehke seal konto. (Kui ei)
2) Minge Amazon Redshifti konsooli järgmisele lingile: -
https://console.aws.amazon.com/redshift/
3) Nüüd peame looma rolli MINA OLEN, peame navigeerima allolevale lingile: -
https://console.aws.amazon.com/iam/
- Minge rollidesse
- Valige rollide loomine.
- Valige AWS-i teenuses Punktne nihe
- Valige punases vahetus - kohandatav, siis edasi: valikul Load valige oma kasutusjuhtum.
- Seadke lubade piir
- Sisestage oma rolli nimi
- Vaadake roll ümber ja looge see.
4) Nüüd peame looma klastri, valides seal konsoolis piirkonnamenüü.
- Valige piirkond, kus klaster luuakse.
- Klõpsake nuppu Launch.
- Peame täitma mitu detaili, näiteks andmebaasi nimi, parool ja kontrollima nuppu Jätka
- Kui klaster on nähtav, kontrollige seda loendis ja vaadake olekuteavet.
- Kui klaster on juba koos meiega, peame järgmiseks seadma turvarühma, siin peame määrama sissetulevate reeglite tüübi protokolli allika ja ulatuse.
- Kontrollige vajalikku konfiguratsiooni ja looge ühendus Redshift Clusteriga.
5) Kui klastritega seotud konfiguratsioonid on tehtud, peame nüüd ühenduse looma oma punase nihkega. Selle punase nihkega saab ühenduse luua otse või SSL-i kaudu. Selle otse ühendamiseks peavad meil olema JDBC / ODBC draiverid, mille peame seadma klastri konfiguratsioonilehele.
Kui need mitmed konfiguratsioonid on kenasti tehtud, oleme valmis kasutama punast tõstukit.
AWS RedShifti eelised -
Miks keegi AWS Redshifti kasutab, peab sellel teenusel olema teiste teenuste ees eelis. Vaatame nüüd mõnda Redshifti kasutamise eelist.
- Kiire : päringu töötlemise aeg on suhteliselt kiirem kui teiste andmetöötlusriistade puhul ja andmete visualiseerimisel on palju selge pilt.
- Hulgiandmete töötlemine : - suurema andmemahu korral on punane nihe võimeline töötlema tohutul hulgal andmeid rohke aja jooksul.
- Minimaalne andmekaotus: - kuna andmeid jaotatakse klastrisse ja töödeldakse võrgus paralleelselt, on andmete kadumise võimalus minimaalne ja töödeldatud andmete täpsuse määr on parem.
- Tasuv : - Olles kulutõhus, on see odavam kui ükski teine saadaolev alternatiiv, mis muudab selle tugevaks kogu tööstuses. Kuna hinnakujundus on väiksem, võime mahutada suure hulga andmeid ja töödelda neid eelarve piires.
- SQL-liides : Redshiftil põhinev päringumootor on sama, mis Postgres SQL-i puhul, mis lihtsustab SQL-i arendajatel sellega mängimist.
- Turvalisus : - Redshiftis olevad andmed on krüptitud, mis on RedShiftis saadaval mitmes kohas. Samuti saame määratleda sissetuleva ja väljamineva reegli, mis muudab andmed palju turvalisemaks.
Punase nihutamise kui andmelao parema valiku jaoks on palju rohkem eeliseid.
AWS RedShift hinnakujundus -
RedShift pakub hämmastavat hinnakirja, mis meelitab arendajaid või turge selle poole. Kuna sellel on tellitav hinnakujundusfunktsioon, saame seda kasutada veidi üle tunni ja klastri sõlmede arvu järgi. Spektrihinna määramine aitab meil käivitada SQL päringuid otse kõigi meie andmetega.
Saame HDD abil luua suuri andmeladusid väga madala hinnaga. Täpsema hinnakujunduse üksikasjade kohta leiate Amazoni allpool esitatud dokumendist: -
https://aws.amazon.com/redshift/pricing/
Ülaltoodud dokumendis on kõik üksikasjad AWS REDSHIFTi erinevate hindade kohta.
Järeldus
Ülaltoodud artiklist, mida nägime Redshifti kohta, peab meil nüüd olema õiglane idee selle kohta, mis punane nihe tegelikult on ja selle kasutamist. RedShift, mis on nii väga skaleeritav ja hõlpsasti kasutatav, võtab tööstuses kõige laialdasemalt kasutusele Amazoni mitmesuguste muude tehnoloogiate toel, mis muudab selle võimsamaks. Nii et Redshift pakub andmeid täis maailmas väga head andmehoidlate ja -protsesside paketti.
Soovitatavad artiklid
See on juhend jaotises Mis on AWS RedShift. Siin käsitleme AWS RedShifti toimimist, kasutamist ja eeliseid. Lisateabe saamiseks võite vaadata ka järgmist artiklit -
- AWS-i arhitektuur
- Mis on AWS?
- Mis on Azure?
- Mis on AWS Lambda?
- AWS-i salvestusteenused