Ülevaade R andmekaadrist

Andmeraamid on võrdse pikkusega vektorite loend. Maatriksi ja andmeraamide erinevus seisneb aga selles, et andmeraamid võtavad vastu erinevat tüüpi andmeid. (Märk, arv jne). Selles teemas õpime tundma R Data Frame'i.

Andmeraamide kasutamise eelised

  • Jaotatud andmete kogumine ja korraldamine.
  • Sellel on paremad optimeerimised võrreldes relatsiooniandmebaasiga.
  • Hoiab mitmesuguseid andmeid, mis on heterogeensed.

Andmeraami loomine R-s

Loome andmekaadri. Allpool on näide andmeraami deklareerimiseks.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

Ülaltoodud näites ei ole me muutujaid määratlenud. Vaatame nüüd, kuidas määrame muutujatele väärtused ja salvestame need andmeraami.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Väljund:

Arv alfa-Booleans

1 2 x TÕESTI

2 3 y TÕESTI

3 4 z VABA

Andmekarkassi struktuur

Kui tahame teada konkreetse andmeraami ülesehitust. Saame kasutada allpool toodud funktsiooni.

Tärn ()

str(Data_frame)

Väljund:

Arv: num 2 3 4

alfa: teguri w / 3 tasemed “x”, “y”, “z”: 1 2 3

Booleans: logi TRUE TRUE FALSE

Konkreetsete andmete kaevandamine andmeraamist

1. Veeru nime kasutamine

Teatava kogumi andmeid saame andmebaasist välja tõmmata.

Ülaltoodud näites ekstraheerime andmeraamistikust ainult number esimese numbri.

Data_ frame <- data. Frame(Number)

Väljund:

Arv

1 2

2 3

3 4

2. Ridade kasutamine

Saame andmeid ridadelt kaevandada, nagu allpool toodud näites.

Oletame, et tahame printida ainult kaks rida veergu Number.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Väljund:

Arv alfa-Booleans

1 2 x TÕESTI

2 3 y TÕESTI

3 4 z VABA

------------

Arv alfa-Booleans

1 2 x TÕESTI

2 3 y TÕESTI

Saame jälgida erinevust esimeses ja teises väljundis.

3. Konkreetsete ridade ja veergude printimine

Saame printida ka konkreetseid ridu ja veerge.

Allpool toodud näites trükime 1. ja 2. rea veerud

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Väljund:

Arv alfa-Booleans

1 2 x TÕESTI

2 3 y TÕESTI

3 4 z VABA

-------------

Arv alfa

1 2 x

2 3 a

4. Uue veeru lisamine andmeraami

Andmeraami saame lisada veel ühe veeru koos väärtustega.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Väljund:

Arv alfa Booleans klass

1 2 x TRUE A

2 3 y TÕENE B

3 4 z VABA C

5. Andmeraamile rea lisamine

Kasutame funktsiooni rbind uue rea lisamiseks olemasolevale andmeraamile.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Väljund:

Arv alfa Booleans klass

1 2 x TRUE A

2 3 y TÕENE B

3 4 z VABA C

4 5 x FALSE D

6. Mõlema andmeraami ühendamine

Samuti saame ühe väljundi saamiseks ühendada kaks andmeraami.

Kahe andmeraami ühendamiseks peab andmekaadrite jaoks olema sama veerg.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Väljund:

Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
--------------
Arv alfa-Booleans
1 4 x TÕESTI
2 5 a TÕESTI
3 6 z VABA

--------------

Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
4 4 x TÕESTI
5 5 a TÕESTI
6 6 z VABA

Andmeraamide kontrollimine

Allpool on toodud erinevad viisid andmeraami kontrollimiseks ja see sisaldab teavet andmeraami kohta, nagu ülaltoodud tärnifunktsioon.

1. Nimed - Annab andmeraami muutujate nimed

Süntaks : names(data frame name)

Näide

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

väljund : (1) “Arv” “alfa” “Booleans”

2. Kokkuvõte - pakub andmeraami statistikat.

Süntaks: summary(data frame name)

Näide

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Väljund:

Arv alfa-Booleans
Min : 2, 0 x: 1 Režiim: loogiline
1.kv: 2.5.5 y: 1 VIGA: 1
Keskmine: 3, 0 z: 1 TÕELIS: 2
Keskmine: 3, 0 NA: 0
3. kv: 3, 5
Maks. : 4.0

3. Head - annab andmed paari esimese rea kohta.

Süntaks: Head( name of the data frame) andmeraami Head( name of the data frame)

Näide

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Väljund:

Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
4 5 a TÕESTI
5 6 b VABA
6 7 c VABA

4. Tail - prindib andmeraami paar viimast rida.

Süntaks: tail( name of the data frame) andmeraami tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Väljund:

Arv alfa-Booleans
5 6 b VABA
6 7 c VABA
7 8 d VALE
8 9 f VABA
9 10 g VABA
10 11 j VABA

Järeldus

Andmeraamid on R-programmeerimisel oluline mõiste. See on lihtne, kuid samas võimas selliste andmekogumite loomisel, mida saab muuta ja millele on hõlpsasti juurde pääseda. Nii nagu maatriksile, on andmekogudele juurde pääseda ridade ja veergude nimede kaudu, andmete hõlpsaks lisamiseks ja eemaldamiseks.

Soovitatavad artiklid

See on R Data Frame'i juhend. Siin käsitleme andmeraami loomist R-s struktuuriga ja konkreetsete andmete väljavõtmist andmeraamist. Võite lisateabe saamiseks vaadata ka järgmisi artikleid -

  1. Andmetüübid C-s
  2. Andmeteaduse karjäär
  3. Suurandmete tehnoloogiad
  4. Andmeteaduse platvorm
  5. Java Booleans

Kategooria: