Ülevaade kahesuunalisest ANOVA-st R-s
Kahesuunaline ANOVA (variatsioonianalüüs) aitab meil mõista seost ühe pideva sõltuva muutuja ja kahe kategoorilise sõltumatu muutuja vahel. Selles teemas õpime R-s kahesuunalise ANOVA kohta.
Allpool on toodud kahesuunalise ANOVA huvipakkuv hüpotees
- H₀: nimetage seda peamiseks efektiks, mis on esimene tegur, mis sõltub pidevast muutujast
- H₀: peamine efekt on ka mõju kohta teisele muutujale sõltuval pideval muutujal.
- H₀: interaktsioon on mõlema esimese, teise teguri muutuja koosmõju sõltuvale muutujale
Allpool on toodud normid, millele kahesuunaline ANOVA peab vastama.
- Vaatlused peavad olema sõltumatud
- Vaatlusi tuleks tavaliselt levitada.
- Vaatlustes peaksid olema võrdsed erinevused
- Disainis pole mingeid kõrvalnähte
- Vead peaksid olema sõltumatud.
Märge
Normaalsuse ja võrdse dispersiooni rikkumisel peame oma andmeid muutma.
Näide kahesuunalise ANOVA kohta R-s
Teeme ühesuunalise ANOVA testi vähitaseme andmekogumil, mis sisaldab 48 rida ja 3 andmemuutujat:
Võetud aeg: looma ellujäämise aeg
Erinevad vähi tasemed 1 - 3
Ravi: ravi, mida kasutatakse 1.-3
Enne testi tegemist vajame käes järgmisi andmeid.
- Andmete importimine
- Eemaldage tarbetu muutuja
- Teisendage muutujad (vähktasemed) tellitud tasemeni.
Allpool on andmekogum.
Tähelepanekud: 48
Muutujad: 3
ellujäämisaeg 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
vähi tase 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…
Ravi A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Eesmärgid
- H₀: rühmas ei muutu keskmine elulemus
- H₀: vähemalt ühe rühma ellujäämisaeg on erinev.
Sammud
- Kontrollige vähi taset. Näeme kolme märgi väärtust, kuna teisendame need muteerunud verbiga teguriteks.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Arvutage nii keskmine kui ka standardhälve
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Väljund:
Vibu: 3 x 4
vähitasemete arv_tantsu taset keskmine_aeg sd_aeg
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 277650 0, 06227627
- Kolmandas etapis saate graafiliselt kontrollida, kas jaotuste vahel on erinevus. Pange tähele, et lisate ka täpse punkti.
- Käivitage test käsuga AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Süntaks:
y ~ X1 + X2 +… + Xn (X1 + X2 +… viitab sõltumatutele muutujatele)
y ~. Kasutage kõiki ülejäänud muutujaid iseseisvate muutujatena
Salvestage kindlasti mudel ja printige kokkuvõte.
Kood
- aov (aeg ~ vähitasemed, andmed = df): viige ANOVA test läbi järgmise valemiga
- kokkuvõte (anova_one_way): printige testi kokkuvõte
Df Summa Sq Keskmine Sq F väärtus Pr (> F)
Cancerlevels 2 1, 033 0, 5165 11, 79 7, 66e-05 ***
Jäägid 45 1, 972 0, 0438
-
Signif. koodid: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
P-väärtus on madalam kui lävi 0, 05. Statistilist erinevust tähistab ülaltoodud juhul tärn *.
Ühesuunaline test kahesuunalisele Anovale R-s
Vaatame, kuidas saab ühesuunalist testi laiendada kahesuunalisele ANOVA-le. Test sarnaneb ühesuunalise ANOVA-ga, kuid valem erineb ja lisab valemisse veel ühe rühma muutuja.
y = x1 + x2
- H0 : Mõlema muutuja keskmised on võrdsed (tegurimuutujad)
- H3 : keskmised on mõlema muutuja jaoks erinevad
Lisate ravimuutujad meie mudelisse. See muutuja tähistab patsiendile antud ravi. Teil on huvi teada saada, kas vähktaseme ja patsiendile antud ravi vahel on statistiline sõltuvus.
Kohandame oma koodi, lisades trakti teise sõltumatu muutujaga.
Df Summa Sq Keskmine Sq F väärtus Pr (> F)
Vähi tase 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Ravida 3 0, 9212 0, 3071 12, 27 6.7e-06 ***
Jäägid 42 1, 0509 0, 0250
Nii vähi tase kui ka ravi on statistiliselt erinevad 0-st. Selle abil võime NULL-i hüpoteesi tagasi lükata. Samuti kinnitage, et vähktõve ravi või tüübi muutmine mõjutab ellujäämise aega.
Test
Ühesuunaline ANOVA: H3 - keskmine on vähemalt ühe rühma puhul erinev
Kahesuunaline ANOVA: H3 - keskmine on mõlemas rühmas erinev.
Erinevus ühe- ja kahesuunalise ANOVA vahel
Erinevused ühesuunalise ANOVA ja kahesuunalise ANOVA vahel
Ühesuunaline ANOVA | Kahesuunaline ANOVA |
Kavandatud võimaldama võrdõiguslikkuse testimist kolme või enama vahendi vahel | Kavandatud kahe sõltumatu muutuja omavahelise seose hindamiseks sõltuval muutujal. |
Kaasatakse üks sõltumatu muutuja | Kaasatakse kaks sõltumatut muutujat |
Analüüsitakse 3 või enam kategoorilises rühmas. | Võrdleb kahe teguri mitut rühma |
Ta peab vastama kahele põhimõttele - replikatsioon ja randomiseerimine | Peab vastama kolmele põhimõttele, milleks on replikatsioon, randomiseerimine ja kohalik kontroll. |
Kahesuunalise ANOVA eelised
- Ülaltoodud näites aitab vanus ja sugu meie näites vähendada vea variatsioone, muutes disaini efektiivsemaks.
- Kahesuunaline ANOVA võimaldab meil testida kahe teguri mõju korraga.
ANOVA rakendused
- Erinevate sõidukite läbisõidu, kütuse ja teetüüpide võrdlus.
- Tutvumine temperatuuri, rõhu või keemilise kontsentratsiooni mõjuga mõnele keemilisele reaktsioonile (energiareaktorid, keemiatehased jne)
- Erinevate katalüsaatorite mõju keemiliste reaktsioonide kiirusele
- Reklaamide mõju ja klientide erinevate vastuste arvu mõistmine.
- Bioloogilise jõudluse, kvaliteedi ja kiiruse tootmine (protsess põhineb rakkude arvul, millesse nad jagunevad)
Soovitatavad artiklid
See on juhend kahesuunalisele ANOVA-le R. Siin käsitleme näiteid, eesmärke, samme ja erinevust ühe suuna ja kahesuunalise ANOVA vahel. Võite lisateabe saamiseks vaadata ka järgmisi artikleid -
- ANOVA R-s
- Kuidas tõlgendada tulemusi ANOVA testi abil
- Regressioon vs ANOVA
- GLM R-s