chi-neliön hyvyystesti on hyödyllinen verrata a teoreettinen malli havaittuihin tietoihin. Tämä testi on tyyppi yleisemmälle chi-neliötestille. Kuten minkä tahansa matematiikan tai tilastotieteen aiheen kohdalla, voi olla hyödyllistä käydä läpi esimerkki tapahtumien ymmärtämiseksi esimerkin kautta sopivuuden testin chi-neliön hyvyydestä.
Harkitse vakiopakkausta maitosuklaaa M & Ms. Värit ovat kuusi: punainen, oranssi, keltainen, vihreä, sininen ja ruskea. Oletetaan, että olemme kiinnostuneita näiden värien jakautumisesta ja kysymme, esiintyvätkö kaikki kuusi väriä tasa-arvoisesti? Tämä on tyyppi kysymykseen, johon voidaan vastata sopivuuden testillä.
asetus
Aloitamme huomauttamalla asetus ja miksi sopivuuden testi on sopiva. Värimuuttujamme on kategorinen. Tätä muuttujaa on kuusi tasoa, jotka vastaavat kuutta mahdollista väriä. Oletetaan, että laskemme M & Ms ovat yksinkertainen satunnainen otos kaikkien M & Ms: n väestöstä.
Nolla ja vaihtoehtoiset hypoteesit
nolla ja vaihtoehtoiset hypoteesit
sopivuuden hyvyystestimme heijastaa olettamusta, jonka teemme väestöstä. Koska testaamme, esiintyvätkö värit yhtä suuressa osassa, nollahypoteesimme on, että kaikki värit esiintyvät samassa suhteessa. Muodollisemmin, jos p1 on punaisten karkkien väestöosuus, p2 on oranssien karkkien väestöosuus ja niin edelleen, nolla hypoteesi on, että p1 = p2 =... = p6 = 1/6.Vaihtoehtoinen hypoteesi on, että ainakin yksi populaatiosuhteista ei ole yhtä suuri kuin 1/6.
Todelliset ja odotetut määrät
Todelliset määrät ovat karkkien lukumäärä jokaisessa kuudessa värissä. Odotettu lukumäärä viittaa siihen, mitä voisimme odottaa, jos nollahypoteesi olisi totta. Annamme n olla näytteemme koko. Odotettu määrä punaisia karkkeja on p1 n tai n/6. Itse asiassa tässä esimerkissä karkkien odotettu lukumäärä jokaisessa kuudessa värissä on yksinkertaisesti n ajat pminätai n/6.
Chi-neliötilastot sopivuuden hyvyydestä
Laskemme nyt chi-neliötilastot tietylle esimerkille. Oletetaan, että meillä on yksinkertainen satunnainen näyte 600 M&M -karkista seuraavalla jakelulla:
- 212 makeisista on sinisiä.
- 147 makeisista on oransseja.
- 103 karkkia on vihreää.
- 50 karkkia on punaista.
- 46 karkkia on keltaista.
- 42 karkkeista on ruskeita.
Jos nollahypoteesi olisi totta, kunkin näistä väreistä odotettavissa olevat määrät olisivat (1/6) x 600 = 100. Käytämme tätä nyt laskettaessa chi-neliötilastoja.
Laskemme jokaisen värin vaikutuksen tilastoihimme. Jokainen on muodossa (todellinen - odotettu)2/Expected.:
- Sinisellä meillä on (212 - 100)2/100 = 125.44
- Oranssille meillä on (147 - 100)2/100 = 22.09
- Vihreää varten meillä on (103 - 100)2/100 = 0.09
- Punaiselle meillä on (50 - 100)2/100 = 25
- Keltaisella meillä on (46 - 100)2/100 = 29.16
- Ruskeaksi meillä on (42 - 100)2/100 = 33.64
Sitten lasketaan yhteen kaikki nämä osuudet ja määritetään, että ki-neliötilastomme on 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.
Vapauden asteet
Lukumäärä vapauden asteet sopivuuden testi on yksinkertaisesti yksi pienempi kuin muuttujamme tasojen lukumäärä. Koska värejä oli kuusi, meillä on 6 - 1 = 5 vapausastetta.
Chi-neliötaulukko ja P-arvo
Laskettu ki-neliötilasto 235.42 vastaa tiettyä sijaintia viiden vapausasteen omaavalla ki-neliöjakaumalla. Tarvitsemme nyt p-arvo, jotta määritettäisiin todennäköisyys saada testitilastot vähintään yhtä äärimmäinen kuin 235,42 olettaen, että nollahypoteesi on totta.
Microsoftin Exceliä voidaan käyttää laskelmassa. Huomaamme, että testitilastomme, jolla on viisi vapausastetta, p-arvo on 7,29 x 10-49. Tämä on erittäin pieni p-arvo.
Päätössääntö
Päätämme hylätä nollahypoteesin p-arvon koon perusteella. Koska p-arvo on erittäin pieni, hylkäämme nollahypoteesin. Päätelmämme on, että M & Ms eivät ole jakautuneet tasaisesti kuuden eri värin kesken. Seurantanalyysiä voitaisiin käyttää määrittämään luottamusväli yhden tietyn värin populaatiosuhteelle.