ANOVA (varianssianalyysi)

click fraud protection

Monta kertaa, kun tutkimme ryhmää, vertaamme todella kahta populaatiota. Riippuen parametri Tästä kiinnostuneesta ryhmästämme ja käsiteltävistä olosuhteista on useita tekniikoita. tilastollinen päättely menettelyjä, jotka koskevat kahden populaation vertailua, ei yleensä voida soveltaa kolmeen tai useampaan populaatioon. Tarvitaan erityyppisiä tilastollisia välineitä, jotta voimme tutkia useampaa kuin kahta populaatiota kerralla. Varianssianalyysi, tai ANOVA, on tekniikka tilastollisista häiriöistä, jonka avulla voimme käsitellä useita populaatioita.

Keinojen vertailu

Tarkastelemme esimerkkiä nähdäksesi mitä ongelmia syntyy ja miksi tarvitsemme ANOVA: ta. Oletetaan, että yritämme selvittää, onko tarkoittaa vihreiden, punaisten, sinisten ja oranssien M&M -karkkien painot eroavat toisistaan. Ilmoitamme kunkin näiden populaatioiden keskimääräiset painot, μ1, μ2, μ3 μ4 ja vastaavasti. Voimme käyttää asianmukaista hypoteesitesti useita kertoja ja koe C (4,2) tai kuusi erilaista nolla hypoteesit:

instagram viewer
  • H0: μ1 = μ2 tarkistaa, eroaako punaisten karkkien populaation keskimääräinen paino kuin sinisten karkkien populaation keskimääräinen paino.
  • H0: μ2 = μ3 tarkistaa, eroaako sinisten karkkien väestön keskimääräinen paino kuin vihreiden karkkien populaation keskimääräinen paino.
  • H0: μ3 = μ4 tarkistaa, eroaako vihreiden karkkien väestön keskimääräinen paino kuin oranssien karkkien väestön keskimääräinen paino.
  • H0: μ4 = μ1 tarkistaa, eroaako oranssien karkkien väestön keskimääräinen paino kuin punaisten karkkien populaation keskimääräinen paino.
  • H0: μ1 = μ3 tarkistaa, eroaako punaisten karkkien väestön keskimääräinen paino kuin vihreiden karkkien populaation keskimääräinen paino.
  • H0: μ2 = μ4 tarkistaa, eroaako sinisten karkkien väestön keskimääräinen paino kuin oranssien karkkien populaation keskimääräinen paino.

Tällaiseen analyysiin liittyy monia ongelmia. Meitä on kuusi p-arvot. Vaikka voimme testata jokaisen 95%: lla luottamustaso, luottamuksemme kokonaisprosessiin on vähemmän kuin tämä, koska todennäköisyydet kerrotaan: .95 x .95 x .95 x .95 x .95 x .95 on noin .74 tai 74%: n luottamus. Täten tyypin I virheen todennäköisyys on kasvanut.

Perusteellisemmalla tasolla emme voi verrata näitä neljää parametria kokonaisuutena vertaamalla niitä kahta kerrallaan. Punaisen ja sinisen M & Ms: n keskiarvo voi olla merkittävä, punaisen keskimääräisen painon ollessa suhteellisen suurempi kuin sinisen keskimääräinen paino. Kun tarkastellaan kaikkien neljän tyyppisten karkkien keskipainoa, ei kuitenkaan välttämättä ole merkittävää eroa.

Varianssianalyysi

Käytämme ANOVAa tilanteissa, joissa meidän on tehtävä useita vertailuja. Tämän testin avulla voimme harkita useiden populaatioiden parametrejä kerralla, ilman, että joudumme käsittelemään joitain meitä kohtaamista ongelmista hypoteesitestien suorittaminen kahdella parametrilla kerrallaan.

Suorittaaksemme ANOVA: n yllä olevan M&M-esimerkin avulla, testaamme nollahypoteesi H01 = μ2 = μ3= μ4. Tämä väittää, että punaisen, sinisen ja vihreän M & Ms: n keskimääräisissä painoissa ei ole eroa. Vaihtoehtoinen hypoteesi on, että olemassa on jonkin verran eroa punaisen, sinisen, vihreän ja oranssin M & Ms: n keskimääräisten painojen välillä. Tämä hypoteesi on todella yhdistelmä useita lausuntoja H:

  • Punaisten karkkien populaation keskimääräinen paino ei ole sama kuin sinisten karkkien populaation keskimääräinen paino, TAI
  • Sinisten karkkien populaation keskimääräinen paino ei ole sama kuin vihreiden karkkien populaation keskimääräinen paino, TAI
  • Vihreiden karkkien populaation keskimääräinen paino ei ole yhtä suuri kuin oranssien karkkien populaation keskimääräinen paino, TAI
  • Vihreiden karkkien populaation keskimääräinen paino ei ole yhtä suuri kuin punaisten karkkien populaation keskimääräinen paino, TAI
  • Sinisten karkkien populaation keskimääräinen paino ei ole sama kuin oranssien karkkien populaation keskimääräinen paino, TAI
  • Sinisten karkkien populaation keskimääräinen paino ei ole yhtä suuri kuin punaisten karkkien populaation keskimääräinen paino.

Tässä nimenomaisessa tapauksessa, jotta saataisiin p-arvo, käytämme a todennäköisyysjakauma tunnetaan nimellä F-jakauma. ANOVA F -testin sisältävät laskelmat voidaan tehdä käsin, mutta ne lasketaan tyypillisesti tilastollisilla ohjelmistoilla.

Useita vertailuja

ANOVA muista tilastollisista tekniikoista erottaa sen, että sitä käytetään useiden vertailujen tekemiseen. Tämä on yleistä kaikissa tilastoissa, koska haluamme monta kertaa verrata enemmän kuin kahta ryhmää. Tyypillisesti kokonaistesti viittaa siihen, että tutkittavien parametrien välillä on jonkinlainen ero. Seuraamme sitten tätä testiä jollain muulla analyysillä päättääksesi mikä parametri eroaa.

instagram story viewer