Ülevaade R andmekaadrist
Andmeraamid on võrdse pikkusega vektorite loend. Maatriksi ja andmeraamide erinevus seisneb aga selles, et andmeraamid võtavad vastu erinevat tüüpi andmeid. (Märk, arv jne). Selles teemas õpime tundma R Data Frame'i.
Andmeraamide kasutamise eelised
- Jaotatud andmete kogumine ja korraldamine.
- Sellel on paremad optimeerimised võrreldes relatsiooniandmebaasiga.
- Hoiab mitmesuguseid andmeid, mis on heterogeensed.
Andmeraami loomine R-s
Loome andmekaadri. Allpool on näide andmeraami deklareerimiseks.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
Ülaltoodud näites ei ole me muutujaid määratlenud. Vaatame nüüd, kuidas määrame muutujatele väärtused ja salvestame need andmeraami.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Väljund:
Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
Andmekarkassi struktuur
Kui tahame teada konkreetse andmeraami ülesehitust. Saame kasutada allpool toodud funktsiooni.
Tärn ()
str(Data_frame)
Väljund:
Arv: num 2 3 4
alfa: teguri w / 3 tasemed “x”, “y”, “z”: 1 2 3
Booleans: logi TRUE TRUE FALSE
Konkreetsete andmete kaevandamine andmeraamist
1. Veeru nime kasutamine
Teatava kogumi andmeid saame andmebaasist välja tõmmata.
Ülaltoodud näites ekstraheerime andmeraamistikust ainult number esimese numbri.
Data_ frame <- data. Frame(Number)
Väljund:
Arv
1 2
2 3
3 4
2. Ridade kasutamine
Saame andmeid ridadelt kaevandada, nagu allpool toodud näites.
Oletame, et tahame printida ainult kaks rida veergu Number.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Väljund:
Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
------------
Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
Saame jälgida erinevust esimeses ja teises väljundis.
3. Konkreetsete ridade ja veergude printimine
Saame printida ka konkreetseid ridu ja veerge.
Allpool toodud näites trükime 1. ja 2. rea veerud
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Väljund:
Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
-------------
Arv alfa
1 2 x
2 3 a
4. Uue veeru lisamine andmeraami
Andmeraami saame lisada veel ühe veeru koos väärtustega.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Väljund:
Arv alfa Booleans klass
1 2 x TRUE A
2 3 y TÕENE B
3 4 z VABA C
5. Andmeraamile rea lisamine
Kasutame funktsiooni rbind uue rea lisamiseks olemasolevale andmeraamile.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Väljund:
Arv alfa Booleans klass
1 2 x TRUE A
2 3 y TÕENE B
3 4 z VABA C
4 5 x FALSE D
6. Mõlema andmeraami ühendamine
Samuti saame ühe väljundi saamiseks ühendada kaks andmeraami.
Kahe andmeraami ühendamiseks peab andmekaadrite jaoks olema sama veerg.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Väljund:
Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
--------------
Arv alfa-Booleans
1 4 x TÕESTI
2 5 a TÕESTI
3 6 z VABA
--------------
Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
4 4 x TÕESTI
5 5 a TÕESTI
6 6 z VABA
Andmeraamide kontrollimine
Allpool on toodud erinevad viisid andmeraami kontrollimiseks ja see sisaldab teavet andmeraami kohta, nagu ülaltoodud tärnifunktsioon.
1. Nimed - Annab andmeraami muutujate nimed
Süntaks : names(data frame name)
Näide
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
väljund : (1) “Arv” “alfa” “Booleans”
2. Kokkuvõte - pakub andmeraami statistikat.
Süntaks: summary(data frame name)
Näide
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Väljund:
Arv alfa-Booleans
Min : 2, 0 x: 1 Režiim: loogiline
1.kv: 2.5.5 y: 1 VIGA: 1
Keskmine: 3, 0 z: 1 TÕELIS: 2
Keskmine: 3, 0 NA: 0
3. kv: 3, 5
Maks. : 4.0
3. Head - annab andmed paari esimese rea kohta.
Süntaks: Head( name of the data frame)
andmeraami Head( name of the data frame)
Näide
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Väljund:
Arv alfa-Booleans
1 2 x TÕESTI
2 3 y TÕESTI
3 4 z VABA
4 5 a TÕESTI
5 6 b VABA
6 7 c VABA
4. Tail - prindib andmeraami paar viimast rida.
Süntaks: tail( name of the data frame)
andmeraami tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Väljund:
Arv alfa-Booleans
5 6 b VABA
6 7 c VABA
7 8 d VALE
8 9 f VABA
9 10 g VABA
10 11 j VABA
Järeldus
Andmeraamid on R-programmeerimisel oluline mõiste. See on lihtne, kuid samas võimas selliste andmekogumite loomisel, mida saab muuta ja millele on hõlpsasti juurde pääseda. Nii nagu maatriksile, on andmekogudele juurde pääseda ridade ja veergude nimede kaudu, andmete hõlpsaks lisamiseks ja eemaldamiseks.
Soovitatavad artiklid
See on R Data Frame'i juhend. Siin käsitleme andmeraami loomist R-s struktuuriga ja konkreetsete andmete väljavõtmist andmeraamist. Võite lisateabe saamiseks vaadata ka järgmisi artikleid -
- Andmetüübid C-s
- Andmeteaduse karjäär
- Suurandmete tehnoloogiad
- Andmeteaduse platvorm
- Java Booleans