Sissejuhatus R Boxploti märgistesse

Boxploti sildid aitavad jaotatud andmeid R-s visualiseerida. Graafik tähistab keskmist, mediaani ja dispersiooni. Väärtused antakse sisendina funktsiooni boxplot (). Funktsioon Boxplot () loob antud sisendandmete abil boxploti. Boxploti saab luua üksikute muutujate või rühma jaoks.

Joonistusgraafiku joonistamine

  • Vajame viit hinnatud sisendit, nagu keskmine, dispersioon, mediaan, esimene ja kolmas kvartiil.
  • Teha kindlaks, kas andmetes on mingeid kõrvalekaldeid.
  • Kujundage mudel andmete joonistamiseks.

Parameetrid funktsiooni boxplot () all

  1. valem: see parameeter võimaldab arvväärtused lekkida mitmesse rühma.
  2. Andmed :: sisendandmed, mis sisaldavad kas andmeraami või loendit.
  3. Alamkomplekt: valikuline vektorparameeter alamhulga määramiseks joonistamiseks.
  4. xlab: x-telje märkus
  5. ylab: y-telje märkus.
  6. vahemik: vahemik määrab krundi laiendid.
  7. tegevus: täpsustage, mis juhtub siis, kui väärtus on null. Kas ignoreerige vastust või väärtust.

Juhuslike andmete loomine

Saame juhusliku valimi andmeid luua funktsiooni rnorm () kaudu.

Kasutame nüüd rnormi (), et luua 10 väärtuse juhuslikke valimiandmeid.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Ülaltoodud käsk genereerib 10 juhuslikku väärtust keskmise 3 ja standardhälbega = 2 ning salvestab selle andmeraami.

Andmete printimisel saadakse allpool toodud väljund.

Stat1

1 2, 662022

2 2, 184315

3 5, 974787

4 4, 536203

5 4, 808296

6 3, 817232

7 1, 135339

8 1, 583991

9 3.308994

10 4, 649170

Saame teisendada sama sisendi (andmed) boxplot funktsiooniks, mis graafiku genereerib.

Lisame andmetele rohkem väärtusi ja näeme, kuidas graafik muutub.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Lisades veel juhuslikke väärtusi ja kasutades seda graafiku esitamiseks.

Allpool on toodud väärtused, mida salvestatakse andmemuutujasse.

STAT 1STAT 2STAT 3STAT 4
3, 7954654, 218645.8275852, 157315
0, 9117264.091196, 2608112.26594
3.7078283.359875.889453, 714557
0, 1157724.51235.9348582, 40645
0, 6975562, 159456, 811472, 571304
5.1292313.26986, 2500683.025175
5.4041014.389395.6700612.9901
1, 4550663, 130595.6923232, 69693
0, 8686365.423115.4154352, 674768
2.141133, 907286, 2060592, 806656

Allpool on 40 väärtusega boxplot-graafik. Y-teljel on 1-7 numbrit ja x-teljel stat1 kuni stat4.

X-telje teksti joondamist saame muuta, kasutades teist parameetrit, mille nimi on las = 2.

R Boxploti siltide graafiku analüüsimine

Oleme sisendi andnud andmeraami ja näeme ülaltoodud graafikut.

Andmete mõistmiseks vaatame stat1 väärtusi.

Graafik tähistab kõiki 5 väärtust. Alustades miinimumväärtusest alt ja seejärel kolmanda kvartiili, keskmise, esimese kvartiili ja minimaalse väärtusega.

Ülaltoodud graafikul on teksti joondamine horisontaalselt x-teljel.

Värvi muutmine

Kõigil ülaltoodud näidetel oleme näinud süžeed mustvalgelt. Vaatame, kuidas muuta krundi värvi.

Funktsiooni boxplot () saab lisada parameetri col = color.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Altpoolt näeme proovitüki väljundit punaselt.

Kasutades sama ülaltoodud koodi, saame krundile lisada mitu värvi.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Siltide lisamine

Sildid saab lisada funktsiooni boxplot () parameetrite xlab, ylab abil.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Põhiparameetri abil saame graafikule lisada pealkirja.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Paragrahvi Notch kasutatakse graafiku arusaadavamaks muutmiseks. Kuna stat1 kuni stat4 mediaanid ei ühti ülaltoodud graafikul.

Karbi krundi eelised ja puudused

Eelised

  • Boxplot siltide abil on lihtne suures koguses andmeid kokku võtta.
  • Kuvab telje ulatuse ja andmete jaotuse.
  • See näitab sümmeetriat ja viltu
  • Aitab tuvastada andmetes kõrvalnähtusid.

Puudused

  • Saab kasutada ainult arvandmete jaoks.
  • Kui andmetes on lahknevusi, ei saa kastide graafik olla täpne.

Märkused:

  1. Graafikud peavad olema korralikult märgistatud.
  2. Kaalud on olulised; skaala muutmine võib anda andmetele erineva ülevaate.
  3. Andmete võrdlus õigete skaaladega peaks olema järjepidev

Järeldus - R Boxploti sildid

Andmete grupeerimine on kastihunnikute abil hõlbus. Kasti graafik toetab nii mitut muutujat kui ka mitmesuguseid optimeerimisi. Samuti võime andmeid skaala järgi varieerida.

Plokkdiagramme saab kasutada erinevate andmemuutujate või komplektide võrdlemiseks.

Boxploti kasutatavus on lihtne ja mugav. Vajame järjepidevaid andmeid ja korralikke silte. Boksiplotte kasutatakse sageli andmeteaduses ja isegi müügimeeskondade poolt andmete rühmitamiseks ja võrdlemiseks. Boxplot annab ülevaate andmete potentsiaalist ja optimeerimistest, mida saab müügi suurendamiseks teha.

Boxplot on huvitav viis andmete testimiseks, mis annab ülevaate andmete mõjust ja potentsiaalist.

Soovitatavad artiklid

See on juhend R Boxploti siltide kohta. Siin käsitleme funktsiooni boxplot () all olevaid parameetreid, kuidas luua juhuslikke andmeid, muutes värvi- ja graafianalüüsi koos eeliste ja puudustega. Lisateabe saamiseks võite vaadata ka järgmist artiklit -

  1. Andmete visualiseerimise tüübid
  2. Andmelao juurutamine
  3. Andmeteaduse tehnikad
  4. Mis on Data Cube?

Kategooria: