Sissejuhatus Data Mart
Maailm on muutumas digitaalsemaks ja iga organisatsioon genereerib mitu petabaiti andmeid. Data Mart on üks selline andmete liigitus andmelaost, kus kontsentratsioon on ühel subjektil.
Võib öelda, et need on andmed konkreetse osakonna või kategooria kohta, nagu müük, rahandus või turundus jne. Põhimõtteliselt on see andmete ladustamise alamhulk. Kuna keskendutakse kindlatele ainetele või osakondadele, võime öelda, et selle allikas on piiratud või see sõltub väga vähestest allikatest.
Data Mart vs Data Warehouse
Andmeladu on ladu, mis sisaldab andmete kogumist subjekti mitmest voost. Hooldus- ja kontrolliosaga, nagu töötlemata andmete kogumine ja töötlemine, tegelevad peamiselt ettevõtete infotehnoloogia IT-rühmad, kes pakuvad emaettevõtjatele mitmesuguseid teenuseid.
Andmeladu nimetatakse ka keskseks või ettevõtte andmelaoks. Seega on andmelao allikas mitmekordne, erinevalt andmetest, mis mõnel juhul on andmelao alamhulk.
Andmetüübid Mart
Tavaliselt on andmeid kolme tüüpi. Nemad on:
1. Sõltuv andmeladu
Sõltuv andmemaht pärineb puhtalt andmelaost ja kõik grupeeritud sõltuvad moodustavad ettevõtte andmelao. See on puhtalt andmelao alamhulk, kuna see on loodud kesksest DW-st.
Kuna keskandmelaos on juba olemas puhtad ja kokkuvõtlikud andmed, on ETT protsess või väljavõtte teisendamine ja transportimine lihtsustatud. Peame siin lihtsalt konkreetse alamhulga tuvastama ja ETT-d selle peal täitma.
Need andmekaardid on tavaliselt üles ehitatud parema kättesaadavuse ja palju parema jõudluse saavutamiseks koos parema juhtimise ja tõhususega.
2. Sõltumatu Andmete Mart
See ei ole loodud keskses andmelaost ja selle allikas võib olla erinev. Kuna andmed pärinevad muust kui DW ETT protsessist, on natuke erinev.
Suuremat osa sõltumatutest andmetest kasutab väiksem grupp organisatsioone ja ka selle allikas on piiratud. Independent data mart luuakse üldiselt siis, kui peame leidma lahenduse suhteliselt lühema aja jooksul.
3. Hübriidandmed Mart
Hübriidandmed võimaldavad rühmitada andmeid kõigist muudest allikatest peale keskse andmelao DW. Kui tegeleme ad hoc integratsiooniga, on see suureks eeliseks kõigi toodete jaoks, mis on organisatsioonidesse väliselt lisatud.
Data Mart omadused
Allpool on mõned andmemarti funktsioonid:
- Kuna andmeallikas on koondatud subjektile, pikendatakse selle abil kasutaja reageerimise aega.
- Sageli nõutavate andmete jaoks on andmekaartide kasutamine kasulik, kuna see on alajaotuses kesksele DW-le ja seetõttu on andmete suurus väiksem.
- Kuna andmete maht on piiratud, väheneb töötlemisaeg võrreldes keskmiste andmetega.
- Need on põhimõtteliselt paindlikud ja suudavad mudelis tehtud muudatusi andmelaoga võrreldes üsna kiiresti ja tõhusalt vastu võtta.
- Datamart nõuab erinevalt laoandmetest erinevatel ladudel vajalike ekspertiiside käsitlemiseks ühe teema asjatundjat. Seetõttu väidame, et andmed on paindlikumad.
- Me võime eraldada juurdepääsu kategooriad madalaks jaotatud andmetega ja andmetega mart on see väga lihtne.
- Infrastruktuurisõltuvus on üsna piiratud ja segmenteerimisel saab andmeid hoida erinevatel riistvaraplatvormidel.
Andmete Mart rakendamise sammud
Allpool on toodud juhised selle rakendamiseks.
1. Kujundamine
See on esimene samm juurutamisel, kus tuvastatakse kõik vajalikud ülesanded ja allikad tehnilise ja äriteabe kogumiseks. Hiljem rakendatakse loogiline plaan ja pärast ülevaatamist muudetakse see füüsiliseks plaaniks. Samuti otsustatakse siin andmete loogilise ja füüsilise ülesehituse üle, näiteks kuidas andmeid ja partitsiooni välja nagu kuupäeva või mõnda muud faili osadeks jagada.
2. Ehitus
See on teine rakendusetapp, kus RDBMSi abil loodi füüsilised andmebaasid, mis määrati kindlaks osana projekteerimisprotsessist ja loogilistest struktuuridest. Kõik objektid nagu skeem, indeksid, tabelid, vaated jne on loodud.
3. asustamine
See on kolmas etapp ja siin sisestatakse andmed selle hankimisel. Enne vajalike andmete sisestamist rakendatakse kõik vajalikud teisendused.
4. Juurdepääs
See on järgmine rakendusetapp, kus aruannete loomiseks küsitakse asustatud andmete abil päringuid. Lõppkasutaja kasutab seda sammu päringute abil andmete mõistmiseks.
5. Juhtimine
See on andmemarti rakendamise viimane etapp ja siin hoolitsetakse mitmesuguste ülesannete eest, nagu näiteks juurdepääsuhaldus, süsteemi optimeerimine ning andmete mälule seadistamine, haldamine ja värskete andmete lisamine ning Martti taastamise stsenaariumide kavandamine kõigi rikkejuhtumite käsitlemiseks.
Data Mart eelised
Järgnevalt on toodud mõned selle kasutamise eelised.
- See on üks parimaid kulutõhusaid alternatiive andmelaole, kus peate töötama ainult väikese andmesegmendi kallal.
- Andmete eraldamine allikatest muudab andmete kogumise tõhusaks, kuna konkreetne inimrühm saab andmeid lao asemel kasutada konkreetsest allikast.
- Kiirem juurdepääs andmetele on võimalik andmete kasutamise kaudu, kui teame, millisele alamhulgale me juurdepääsu vajame.
- Datamarti on palju lihtsam kasutada, nii et lõppkasutajad saavad nende peal hõlpsalt päringuid teha.
- Rakendusaja juurde jõudmine nõuab mart võrreldes andmelaoga vähem aega, kuna andmed on rühmadesse eraldatud.
- Konkreetse subjekti ajaloolisi andmeid saab kasutada trendide hõlpsaks analüüsiks.
Järeldus
Kuna see on keskendunud ühele funktsionaalsele alale, on sellel mitmeid eeliseid nii protsesside juurutajale kui ka lõppkasutajale. Seetõttu on organisatsioonis vaja ka andmeladu ja tõhusat kaardimaterjalide rakendamist.
Soovitatavad artiklid
See on juhend jaotises Mis on Data Mart. Siin käsitleme sissejuhatust, funktsioone ja 3 parimat tüüpi koos selle omaduste ja sammudega. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -
- Oracle'i andmete ladustamine
- R andmetüübid
- Pythoni andmetüübid
- Cassandra andmete modelleerimine
- Cassandra andmemudeli täielik juhend