Sissejuhatus andmete visualiseerimise tüüpidesse
Kaasaegses suurandmete areenil, kus on üle 2, 5 kvintilli baiti (1 kvintiili baiti = 10 18 baiti!) Iga päev loodud andmeid (vastavalt socialmediatoday.com), on vaja andmeid säilitada. Ütlematagi selge, et need andmed on tihedad ja seega mitte nii kasutajaloetavad ning pidevalt keskendumata. Andmete ulatuse hõlpsaks mõistmiseks ja ettevõttes kasulike eeliste saamiseks paradigma nihutamiseks tuleb andmed esitada intuitiivsemalt ja seetõttu oleks nende visualiseerimiseks vaja vastavaid diagramme. Andmete tõhusaks kujutamiseks on loodud tööriistad ja metoodikad, kuid tõhusus sõltub enamasti andmete tüübist ja andmetest eraldamise nõudest.
Mis on andmete visualiseerimine?
Andmete visualiseerimine on metoodika, mille abil kujutatakse töötlemata vormingus andmeid, et tuua selle tähendus välja. Suurandmete tulekuga on hädavajalikuks kujundada mõistlik viis andmete esitamiseks, et andmemaht ei muutuks üle jõu. Andmete kujutamise osa saab kasutada erinevatel eesmärkidel, näiteks andmete suundumuste / sarnasuste / mustrite leidmiseks, masinõppe mudelite ehitamiseks või lihtsaks toiminguks, näiteks koondamiseks.
Andmete visualiseerimise erinevad tüübid
Andmete visualiseerimine jaguneb laias laastus 6 erinevat tüüpi. Kuigi andmete visualiseerimise pindala on pidevalt kasvav, ei ole see üllatus, kui kategooriate arv suureneb.
Ajaline: seda tüüpi visualiseerimise andmed peaksid vastama mõlemale tingimusele: esitatud andmed peaksid olema lineaarsed ja olema ühemõõtmelised. Seda tüüpi visualiseerimine on esitatud joonte kaudu, mis võivad kattuda ja millel on ka ühine algus- ja lõpupunkt. | ||
Hajuvuskrundid | Andmepunkti tähistamiseks kasutatakse punkte. Kõige levinum tänapäeva maailmas masinõppes uuritava andmete analüüsi ajal. | ![]() |
Pie diagramm | Seda tüüpi visualiseerimine hõlmab ümmargust graafikat, kus kaare pikkus tähistab suurust. | ![]() |
Polaarpiirkonna diagramm | Sarnaselt Pie-diagrammile on ka polaarpiirkonna diagramm ümmargune graafik, välja arvatud sektorinurgad, on pikkusega võrdsed ja keskpunktist ulatumise kaugus tähistab suurust. | ![]() |
Joondiagrammid | Sarnaselt hajuvdiagrammile on andmed tähistatud punktidega, välja arvatud juhul, kui järjepidevuse säilitamiseks on ühendatud joontega. | ![]() |
Ajajooned | Sel viisil kuvame andmepunktide loetelu ajalises järjestuses. | ![]() |
Ajasarjade järjestused | Aegridades tähistame andmete ulatust kahemõõtmelises graafikus andmete ajatemperatuuri kronoloogilises järjekorras. | ![]() |
Hierarhiline: seda tüüpi visualisatsioonid kujutavad suuremas rühmas järjestatud rühmi. Lihtsas keeles öeldes on nende visualiseerimiste peamine intuitsioon klastrite kuvamine, kui klastrite voog algab ühest punktist. | ||
Puude diagramm | Puuskeemil on hierarhiline voog esitatud puu kujul, nagu nimigi ütleb. Vähesed terminid selle esituse jaoks on:
- juursõlm: lähtepunkt. - Lapsõlm: tal on vanem ülalpool - Lehesõlm: enam lastesõlme. | ![]() |
Ring diagrammid / Sunburst diagramm | Puu kujundus puu diagrammil teisendatakse radiaalseks aluseks. See tüüp aitab puu lühidalt esitleda. Sisemine ring on juursõlm. Ja lapsesõlme pindala tähistab andmete protsenti. | ![]() |
Puukaart | Puu on esindatud tihedalt pakitud ristkülikute kujul. Pindala tähistab sisalduvat kogust. | ![]() |
Ringi pakkimine | Sarnaselt puukaardile kasutab ta ristkülikute asemel ümmargust pakkimist. | ![]() |
Võrk: seda tüüpi visualiseerimine ühendab andmekogumid andmekogudega. Need visualiseerimised kujutavad, kuidas need andmekogumid on võrgus üksteisega seotud. | ||
Maatriksdiagrammid | Seda tüüpi visualiseerimist kasutatakse laialdaselt seose leidmiseks erinevate muutujate vahel. Näiteks korrelatsiooni graafik | ![]() |
Aluuaskeemid | See on teatud tüüpi vooskeem, milles võrgu voo muutused on esitatud kasutaja soovitud intervallide järel. |
|
Sõnapilv | Tavaliselt kasutatakse seda teksti andmete esitamiseks. Sõnad on tihedalt pakitud ja teksti suurus näitab sõna sagedust. |
|
Sõlme-lingi diagrammid | Siin on sõlmed kujutatud punktidena ja toodud on ühendus sõlmede vahel. | ![]() |
Mitmemõõtmeline: erinevalt ajalisest visuaalsuse tüübist, võivad need tüübid olla mitmemõõtmelised. Selles saame kasutada 2 või enamat funktsiooni, et luua samaaegsete kihtide kaudu 3D-visualiseerimist. Need võimaldavad kasutajal esitada võtmevõtted, purustades hulga mittekasulikke andmeid. | ||
Hajuvuskrundid | Mitmemõõtmelistes andmetes valime suvalised 2 tunnust ja joonestame need siis 2-D hajumisdiagrammi. Seda tehes oleks meil n C 2 = n (n-1) / 2 graafikut. | ![]() |
Virnastatud tulpdiagrammid | Esitussegment on ribade peal. See võib olla kas 100% virnastatud tulpdiagramm, kus eraldamine on esitatud protsentides, või lihtne virnastatud tulpdiagramm, mis tähistab tegelikku suurust | ![]() |
Paralleelne koordinaatgraafik | Sellel kujutisel joonistatakse taust ja tõmmatakse n paralleelset joont (n-mõõtmete andmete jaoks). | ![]() |
Georuumiline: need visualiseerimised on seotud tegeliku elu füüsilise asukohaga, ületades selle kaartidega (see võib olla georuumiline või ruumiline kaart). Nende visualiseerimiste taga on intuitiivse ettekujutuse loomine etendusest. | ||
Voolukaart | Esitatakse teabe või objektide liikumine ühest asukohast teise, kus noole suurus näitab summat. | ![]() |
Choroplethi kaart | Georuumiline kaart värvitakse konkreetse andmemuutuja alusel. | ![]() |
Kartogramm | Seda tüüpi esitusviis kasutab kaardistamiseks temaatilist muutujat. Need kaardid moonutavad reaalsust teabe esitamiseks. See tähendab, et konkreetse muutujaga on kaardid liialdatud. Näiteks vasakul olev pilt on ruumikaart, mis on moonutatud mesitarude struktuuriks. | ![]() |
Soojuskaart | Need on georuumilises žanris väga sarnased Choroplethiga, kuid neid saab kasutada ka georuumilistest piirkondadest erinevates piirkondades. | ![]() |
Muu: neid visualiseeringuid ei saa üldistada eriti suures rühmas. Nii et selle asemel, et moodustada üksikutele tüüpidele väiksemad rühmad, grupeeritakse see mitmesugusteks. Allpool on toodud mõned näited: | ||
Diagramm Open-High-Low-Close | Seda tüüpi graafikuid kasutatakse tavaliselt aktsiahindade esitamiseks. Kasvavat trendi nimetatakse bullishks ja langustrendiks kui bullish. | ![]() |
Kagi-diagramm | Tavaliselt kirjeldatakse selle diagrammi abil vara nõudlust ja pakkumist. | ![]() |
Järeldus
Ülaltoodud visualiseerimistüüpide põhjal näeme, et üldiselt on 6 tüüpi rühmi. Ülaltoodud loetelu ei ole ammendav loetelu, kuid vähe neid, mida kasutatakse laialdaselt. Järgnevatel aegadel, kui uusi tüüpe loendisse lisatakse, võib rühmi suureneda. See on tüüpi visualiseerimise jaoks. Jätkaksime sellega, milliseid parameetreid tuleks visualiseerimise tüübi kindlaksmääramisel vaadata.
Soovitatavad artiklid
See on juhend andmete visualiseerimise tüübi kohta. Siin käsitleme sissejuhatust ja andmete visualiseerimise erinevaid tüüpe. Lisateavet leiate ka meie muudest soovitatud artiklitest -
- Andmete analüüsimeetodite tüübid
- Talendi andmete integreerimine
- Andmeanalüüsi tööriistad
- Andmeteaduse tööriistad
- Talendi tööriistad
- Mis on andmete integreerimine?
- Hajakrundid Matlabis
- Tulpdiagrammi kasutamine Matlabis (näited)