Scatterploti tutvustus R-s

  • R on avatud lähtekoodiga programmeerimiskeel, mida kasutatakse andmete statistika koostamiseks ja andmete analüüsimiseks. Andmeteaduse kasvava populaarsuse tõttu on populaarsust kogunud ka R. Seda kasutavad peamiselt andmestatistikud ja andmekaevandajad väärtusliku teabe kaevandamiseks andmetest. R on tõlgendatud keel ja sellel on käsurida, kuid arendaja töö hõlbustamiseks on saadaval palju graafilisi kasutajaliideseid. R pakub statistika ja graafiliste võtete rakendamiseks suures valikus raamatukogusid. R pakub staatilist graafikat; see võimaldab kasutajal luua kihilise graafiku. Seega koostab see trükise kvaliteediga graafikuid ja tagab teabe parema esituse.
  • R pakub graafiliseks rakendamiseks tohutut komplekti raamatukogusid, kuid kõige populaarsem on ggplot2. GGPlot2 on graafika grammatika rakendamine, mis muudab keerukate graafikute loomise lihtsaks. See pakub programmilist liidest muutujate, nende asukoha, graafi värvi, graafi tüüpide ja muude visualiseerimisomaduste täpsustamiseks. See võimaldab teil graafikuid samm-sammult üles ehitada, võimaldades teil luua kihte suure paindlikkuse ja trükikvaliteedi tagamiseks.
  • Üks selline graafikutüüp on Scatterplot R-s. Scatterplot R-s, mida nimetatakse ka hajusdiagrammiks, mis on tüüpi graafik, mis näitab korrelatsiooni kahe muutuja vahel. See näitab andmepunkte punktide kujul. Selle saab tõmmata pideva sõltumatu muutuja ja teise muutuja vahel, mis sõltub eelmisest muutujast või kahest pidevast sõltumatust muutujast. Korrelatsioon võib olla positiivne, negatiivne või olematu. Kui graafiku kalle on vasakult all vasakult paremale, on korrelatsioon positiivne. Kui kalle on vasakust ülaservast paremale, on korrelatsioon negatiivne või teisisõnu väheneb ühe muutuja väärtuse väärtus teise muutuja väärtuses.

Süntaks: graafides on R-s palju pakette, seetõttu on R-s Scatterploti loomiseks palju funktsioone. Kõige põhilisem ja lihtsam funktsioon on

graafik (x, y)

kus

x tähistab horisontaaltelge või sõltumatut pidevat muutujat.

y tähistab vertikaaltelge või sõltuvat muutujat.

Graafiku hõlpsaks mõistmiseks on funktsiooni joonistamiseks palju muid parameetreid.

Allpool on mõned määratlusega:

  • main: lisab graafikule pealkirja
  • xlab: lisage silt x-teljele
  • ylab: lisab sildi y-teljele
  • xlim: määrab x-telje vahemiku
  • ylim: määrab y-telje vahemiku
  • pch: näitab punktide kuju hajutatud graafikul
  • cex: näitab punktide suurust
  • col: määrab punktide värvi

Scatterploti R-s saab luua ka ggplot2 paketi abil. Selleks peame kõigepealt installima ja laadima paketi ggplot2. Pärast paketi lisamist praegusele seansile saab käsku kasutada Scatterploti loomiseks R-s.

ggplot (andmestik, aes (x, y, värv, kuju)) + geom_poin () + labs (x, y, pealkiri)

kus

  • andmestik on andmestik, mille jaoks tuleb luua hajumine.
  • aes () on graafiline esteetiline kaardistamine. See kirjeldab, kuidas muutujad graafikul kaardistatakse.
  • x on horisontaaltelg või sõltumatu pidev muutuja.
  • y on vertikaaltelg või sõltuv muutuja.
  • värv tähendab punktidele värvi lisamist muutuja rühmituse alusel.
  • kuju kasutatakse kuju määramiseks muutuja rühmitamise alusel.
  • + märk näitab, et käsk jätkub.
  • geom_point () on hajutatud graafiku funktsioon.
  • laborid (x, y, pealkiri): lisage graafikule x-silt, y-silt ja pealkiri.

Loo hajutatud joon R-s

Scatterploti loomiseks R-s peame esmalt laadima andmestiku. Kasutame siin R. poolt pakutavat andmestikku (mtcars). Esmalt laadige andmekogum praegusesse seanssi, kasutades käsku allpool

andmed (iiris)

Kui andmestik on laaditud, vaadake allpool oleva käsu abil andmeid, et saada põhiteave andmete tüübi ja selles olevate veergude kohta.

iiris

Pärast põhiteadmiste saamist andmetest laseb graafiku funktsiooni abil luua lihtsa hajumiskaardi

proovitükk (iiris $ Sepal.Pikkus, iiris $ Sepal.Laius, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 5, 0))

Siltide lisamine, et muuta graafik loetavaks

krunt (iiris $ Sepal.Pikkus, iiris $ Sepal.Laius, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 4, 0), xlab = “Sepaali pikkus”, ylab = “Sepaali laius”, peamine = “Laius vs pikkus ”)

Graafiku atraktiivsemaks muutmiseks veel mõne parameetri lisamine

krunt (iiris $ Sepal.Pikkus, iiris $ Sepal.Laius, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 4, 0), xlab = “Sepaali pikkus”, ylab = “Sepaali laius”, peamine = “Laius vs pikkus ”, pch = 8, cex = 1, 5, col = 6)

Lisaks nendele 2-D graafikutele saab R-s luua ka maatriks- ja 3D-graafikuid.

Hajutatud maatriksid

Kui andmekogumis on rohkem kui kaks muutujat ja soovime leida iga muutuja korrelatsiooni kõigi teiste muutujatega, siis kasutatakse hajumisvahemiku maatriksit. Scatterploti maatriksi kõige elementaarsem ja lihtsam käsk on:

paarid (~ Sepal.Pikkus + Sepal.Laius + Petal.Pikkus + kroonleht.Laius, andmed = iiris, main = “Scatterploti maatriks”)

Ülaltoodud graafik näitab korrelatsiooni kaalu, mpg, dsp ja silindri vahel.

Hajutatud 3D

Mõnikord annab 3-mõõtmeline graafik andmete parema mõistmise. Selle R jaoks on mitu paketti, üks neist on “scatterplot3d”. Allpool on käsud installida “scatterplot3d” R-ruumi ja laadida see praegusesse seanssi

install.packages (“scatterplot3d”)

raamatukogu (scatterplot3d)

Pärast teegi laadimist loob allolevate käskude täitmine kolmemõõtmelise hajumise.

kinnita (iiris)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = “3D Scatterplot”)

Lisaks sellele on ka kolmemõõtmelise loomiseks palju muid võimalusi. Graafiku paremaks muutmiseks saavad kasutajad lisada ka üksikasju, näiteks värvi, pealkirju. Samuti saab kasutaja luua interaktiivse 3D hajumise, kasutades “rgl” pakutud funktsiooni “plot3D (x, y, z)”. See funktsioon loob pöörleva 3D hajutatud graafiku, mida saab hiire abil pöörata. Seega antakse muutujate omavahelisest seosest täielik ülevaade.

Järeldus

R on üks kuulsamaid keeli andmeteadlaste kasutatavate graafiliste võtete rakendamiseks. See pakub laias valikus graafikapakette ja raamatukogusid ning paremat andmete mõistmist. “Gglpot2”, “ggvis”, “rgl”, “plot3d”, “võre”, “animatsioon”, “gganimate”, “Kairo” on mõned R poolt pakutavatest pakettidest.

Hajutatud diagramm on lihtsaim viis andmete paremaks mõistmiseks. Selle visualiseerimise abil saab kasutaja teada, kuidas muutujad on üksteisega seotud, kuidas ühe muutuja väärtuse muutmine muudab muude muutujate väärtust jne. Diagrammi kalle räägib muutujate positiivsest ja negatiivsest seosest.

Soovitatavad artiklid

See on juhend Scatterploti juurde R. Siin käsitleme sissejuhatust, scatterploti maatrikseid, scatterplot 3D-d, kuidas luua scatterplot? koos sobivate näidetega. Lisateavet leiate ka meie muudest soovitatud artiklitest -

  1. Mis on GraphQL
  2. Scrum raamistik
  3. R intervjuu küsimused
  4. Sissejuhatus binoomjaotusesse R

Kategooria: