Sissejuhatus ANOVAsse R-s

Järgmine artikkel ANOVA in R annab ülevaate erinevate rühmade keskmise väärtuse võrdlemiseks. Variatsioonianalüüs (ANOVA) on väga levinud tehnika, mida kasutatakse erinevate rühmade keskmise väärtuse võrdlemiseks. ANOVA mudelit kasutatakse hüpoteesi testimisel, kui populatsiooni jaoks luuakse teatud eeldus või parameeter ja hüpoteesi tõese või vale tõestamiseks kasutatakse statistilist meetodit.

Hüpotees tuleneb uurija oletustest ja elanikkonna kohta olemasolevast teabest. ANOVA-d nimetatakse variatsioonianalüüsiks ja seda kasutatakse hüpoteesi testimiseks, kus on vaja mõõta muutuja keskmisi mitmetest sõltumatutest rühmadest.

Näiteks laboris, kus uuritakse või leiutatakse uut rasvumise ravimit, võrdlevad teadlased eksperimentaalse ja standardse ravi tulemusi. Rasvumise uuringust võib saada väärtuslikke tulemusi, kui elanikkonna keskmist rasvumise määra saab võrrelda erinevates vanuserühmades. Sel juhul tuleks jälgida rasvumise keskmist määra eri vanuserühmade vahel, näiteks vanus (5–18), (19, 35) ja (36–50). ANOVA meetodit rakendatakse, kuna iseseisvat rühma on rohkem kui kaks. Sõltumatute rühmade keskmise rasvumise võrdlemiseks kasutatakse ANOVA meetodit. Kasutatakse funktsiooni aov () ja süntaksit on aov (valem, andmed = andmeraam) Selles artiklis õpime tundma ANOVA mudelit ja arutame edasi ühesuunalist ja kahesuunalist ANOVA mudelit koos näidetega.

Miks just ANOVA?

  • Seda tehnikat kasutatakse hüpoteesile vastamiseks, analüüsides mitut andmegruppi. Statistilisi lähenemisviise on mitu, kuid ANOVA väärtust R kasutatakse juhul, kui võrrelda tuleb rohkem kui kahte sõltumatut rühma, nagu meie eelmises näites kolme erinevat vanuserühma.
  • ANOVA tehnika mõõdab sõltumatute rühmade keskmist, et anda teadlastele hüpoteesi tulemus. Täpsete tulemuste saamiseks tuleb arvesse võtta iga üksiku rühma valimi keskmist, valimi suurust ja standardhälvet.
  • Kõigi kolme rühma keskmist on võimalik eraldi võrrelda. Sellel lähenemisviisil on siiski piiranguid ja see võib osutuda ebaõigeks, kuna need kolm võrdlust ei arvesta koguandmeid ja võivad seetõttu põhjustada 1. tüüpi tõrke. R pakub meile ANOVA analüüsi läbiviimise funktsiooni, et uurida varieeruvust sõltumatute andmegruppide vahel. ANOVA analüüsi läbiviimiseks on viis etappi. Esimeses etapis korraldatakse andmed csv-vormingus ja iga muutuja jaoks luuakse veerg. Üks veergudest oleks sõltuv muutuja ja ülejäänud on sõltumatud muutuja. Teises etapis loetakse andmed R-stuudios ja nimetatakse need vastavalt. Kolmandas etapis kinnitatakse üksikute muutujatega andmekogu ja loetakse mälu abil. Lõpuks defineeritakse ja analüüsitakse ANOVA R-s. Allpool toodud jaotistes olen esitanud paar juhtumianalüüsi näidet, milles tuleks kasutada ANOVA tehnikaid.
  • Mõlemal 12 väljal katsetati kuut insektitsiidi ja teadlased lugesid igasse välja jäänud vigade arvu. Nüüd peavad põllumehed teadma, kas insektitsiidid muudavad midagi ja kui jah, siis millist neist kõige paremini kasutada. Sellele küsimusele vastate, kasutades funktsiooni aov () ANOVA teostamiseks.
  • Viiskümmend patsienti said ühte viiest kolesterooli alandava ravimiga (trt). Kolm ravitingimust hõlmasid sama ravimit, mida manustati 20 mg üks kord päevas (1 kord) 10 mg kaks korda päevas (2 korda) 5 mg neli korda päevas (4 korda). Kaks ülejäänud seisundit (ravimD ja ravimE) esindasid konkureerivaid ravimeid. Milline uimastiravi vähendas kõige rohkem kolesterooli taset (ravivastus)?

ANOVA ühesuunaline

  • Ühesuunaline meetod on üks ANOVA põhitehnikaid, milles rakendatakse dispersioonanalüüsi ja võrreldakse mitme elanikkonnarühma keskmist väärtust.
  • Ühesuunaline ANOVA sai oma nime ühepoolselt salastatud andmete kättesaadavuse tõttu. Ühesuunalisel ANOVA-l võib olla saadaval üks sõltuv muutuja ja üks või mitu sõltumatut muutujat.
  • Näiteks teostame kolesterooli andmestikus ANOVA tehnikat. Andmekogum koosneb kahest muutujast trt (mis on töötlemine viiel erineval tasemel) ja vastuse muutujatest. Sõltumatu muutuja - uimastiravi rühmad, sõltuv muutuja - kahe või enama rühma ANOVA keskmised. Nendest tulemustest saate kinnitada, et 5 mg annuse võtmine 4 korda päevas oli parem kui kahekümne mg annuse võtmine üks kord päevas. Ravimil D on selle ravimiga E võrreldes parem toime

Ravim D annab paremad tulemused, kui seda võetakse 20 mg annustes, võrreldes ravimiga E

Kasutab kolesterooli andmestikku multikompides
install.packages('multcomp')
library(multcomp)
str(cholesterol)
attach(cholesterol)
aov_model <- aov(response ~ trt)

Ravi ANOVA F-test (trt) on oluline (p <.0001), mis tõendab, et viis ravi
# pole kõik võrdselt tõhusad.
kokkuvõte (aov_model)
irduma (kolesterool)

Funktsiooni plotmeans () funktsioonis gplots saab kasutada rühmade keskmiste ja nende usaldusvahemike graafiku koostamiseks. See näitab selgelt ravi erinevusi
install.packages('gplots')
library(gplots)
plotmeans(response ~ trt, xlab="Treatment", ylab="Response",
main="Mean Plot\nwith 95% CI")

Uurime TukeyHSD () väljundit paaride erinevuste osas rühmade keskmiste vahel

TukeyHSD (aov_model)

Keskmine kolesterooli alanemine 1 kord ja 2 korda ei erine üksteisest oluliselt (p = 0, 138), samas kui erinevus 1 korra ja 4 korra vahel on oluliselt erinev (p <0, 001).
par (mar = c (5, 8, 4, 2)) # suurendab vasaku veerise graafikut (TukeyHSD (aov_model), las = 2)

Usaldus tulemuste suhtes sõltub sellest, mil määral vastavad teie andmed statistiliste testide aluseks olevatele eeldustele. Ühesuunalises ANOVA-s eeldatakse, et sõltuv muutuja on tavaliselt jaotunud ja selle dispersioon on igas rühmas võrdne. Normaalsuse eelduse raamatukogu (auto) hindamiseks võite kasutada QQ-graafikut.
QQ graafik (lm (vastus ~ trt, andmed = kolesterool), simuleerige = TÕELIS, peamine = ”QQ graafik”, sildid = VIGA)

Punktiirjoon = 95% usalduspiir, mis viitab sellele, et normaalsuse eeldus on üsna hästi täidetud. ANOVA eeldab, et erinevused on rühmade või proovide vahel võrdsed. Selle oletuse kontrollimiseks saab kasutada Bartletti testi
bartlett.test (vastus ~ trt, andmed = kolesterool). Bartletti test näitab, et variatsioonid viies rühmas ei erine oluliselt (p = 0, 97).

ANOVA on tundlik ka kõrvaltoimete testi suhtes, kasutades autokomplektis funktsiooni outlierTest (). Võib-olla ei pea te seda paketti autoteegi värskendamiseks käivitama.
update.packages(checkBuilt = TRUE)
install.packages("car", dependencies = TRUE)
library(car)
outlierTest(aov_model)

Väljundi põhjal on näha, et kolesterooliandmetes pole mingeid märke (NA ilmneb, kui p> 1). Võttes arvesse QQ graafikut, Bartletti testi ja välimiste testi, näivad andmed, et need sobivad ANOVA mudeliga üsna hästi.

Kahesuunaline Anova

Kahesuunalise ANOVA testis lisatakse veel üks muutuja. Kui on kaks sõltumatut muutujat, peame kasutama kahesuunalist ANOVA, mitte ühesuunalist ANOVA tehnikat, mida kasutati eelmisel juhul, kui meil oli üks pidev sõltuv muutuja ja rohkem kui üks sõltumatu muutuja. Kahesuunalise ANOVA kontrollimiseks peavad olema täidetud mitmed eeldused.

  1. Sõltumatute vaatluste kättesaadavus
  2. Vaatlusi tuleks tavaliselt levitada
  3. Variatsioon peaks vaatlustes olema võrdne
  4. Kõrvalekaldeid ei tohiks kohal olla
  5. Sõltumatud vead

Kahesuunalise ANOVA kontrollimiseks lisatakse andmekogumisse veel üks muutuja nimega BP. Muutuja näitab vererõhu määra patsientidel. Tahaksime kontrollida, kas BP ja patsientidele manustatava annuse vahel on statistilisi erinevusi.

df <- read.csv (“file.csv”)
df
anova_two_way <- aov (vastus ~ trt + BP, andmed = df)
kokkuvõte (anova_two_way)

Väljundi põhjal võib järeldada, et nii trt kui ka BP erinevad statistiliselt 0-st. Seega saab nulli hüpoteesi tagasi lükata.

ANOVA eelised uuringus R

ANOVA test määrab kahe või enama sõltumatu rühma keskmise erinevuse. See meetod on väga kasulik mitme üksuse analüüsimisel, mis on turuanalüüsi jaoks hädavajalik. ANOVA testi abil saab andmetest vajalikke teadmisi. Näiteks tooteuuringu ajal, kus kasutajatelt kogutakse mitmesugust teavet, näiteks ostunimekirjad, klientide meeldimised ja mitte meeldimised. ANOVA test aitab meil võrrelda elanikkonna rühmi. Rühm võib olla mees või naine või erinevad vanuserühmad. ANOVA tehnika aitab eristada elanikkonna eri rühmade keskmisi väärtusi, mis on tõepoolest erinevad.

Järeldus - ANOVA R-s

ANOVA on üks kõige sagedamini kasutatavaid meetodeid hüpoteesi testimisel. Selles artiklis oleme viinud viiekümnest patsiendist, kes said kolesterooli vähendavat ravimit, koosnedes ANOVA-testiga, oleme veel näinud, kuidas saab kahesuunalist ANOVA-d läbi viia, kui on olemas täiendav sõltumatu muutuja.

Soovitatavad artiklid

See on juhend ANOVA-st R. Siin käsitleme ühesuunalist ja kahesuunalist Anova mudelit koos ANOVA näidete ja eelistega. Võite vaadata ka meie teisi soovitatud artikleid -

  1. Regressioon vs ANOVA
  2. Mis on SPSS?
  3. Kuidas tõlgendada tulemusi ANOVA testi abil
  4. Funktsioonid R-s

Kategooria: