Joskus tilastoissa on hyödyllistä nähdä työskennellyt esimerkit ongelmista. Nämä esimerkit voivat auttaa meitä selvittämään samanlaisia ongelmia. Tässä artikkelissa käydään läpi päättelytilastojen suorittamisprosessia tuloksesta, joka koskee kahta väestökeinoa. Ei vain näemme kuinka suorittaa hypoteesitesti kahden väkilukukertoimen erotuksesta rakennetaan myös a luottamusväli tätä eroa varten. Käytettyjä menetelmiä kutsutaan joskus kahden näytteen t-testiksi ja kahden näytteen t-luottamusväliksi.
Lausunto ongelmasta
Oletetaan, että haluamme testata luokan koululaisten matemaattisen soveltuvuuden. Yksi kysymys, joka meillä voi olla, on, jos korkeammilla tasoilla on korkeammat keskimääräiset testitulokset.
Yksinkertaiselle satunnaisnäytteelle, joka koostuu 27 kolmannesta luokasta, annetaan matematiikkatesti, heidän vastauksilleen annetaan pisteytys ja tulosten todetaan olevan keskimäärin 75 pistettä näytteen keskihajonta 3 pisteestä.
Yksinkertaisella satunnaisnäytteellä, joka koostuu 20 viidennestä luokkalaisesta, annetaan sama matematiikkakoe ja vastaukset pisteytetään. Viidennen luokkalaisten keskiarvo on 84 pistettä ja näytteen keskihajonta on 5 pistettä.
Tämän skenaarion vuoksi pyydämme seuraavia kysymyksiä:
- Tarjoaako otantatiedot meille todisteita siitä, että kaikkien viidenneiden luokkalaisten populaatioiden keskimääräiset testitulokset ylittävät kaikkien kolmansien luokittelulajien populaation keskimääräiset testitulokset?
- Mikä on 95-prosenttinen luottamusväli kolmansien ja viidennen luokan luokkien populaatioiden keskimääräisten testitulosten erolle?
Ehdot ja menettely
Meidän on valittava käytettävä menettely. Tätä tehtäessä meidän on varmistettava ja tarkistettava, että tämän menettelyn ehdot täyttyvät. Meitä pyydetään vertaamaan kahta väestömäärää. Yksi kokoelma menetelmiä, joita voidaan käyttää tähän, ovat kahden näytteen t-menettelyjen menetelmät.
Jotta näitä t-menettelyjä voidaan käyttää kahdessa näytteessä, meidän on varmistettava, että seuraavat ehdot täyttyvät:
- Meillä on kaksi yksinkertaista satunnaista näytettä kahdesta kiinnostavasta populaatiosta.
- Yksinkertaiset satunnaiset näytteemme eivät edusta enempää kuin 5% väestöstä.
- Nämä kaksi näytettä ovat toisistaan riippumattomia, ja koehenkilöiden välillä ei ole vastaavuutta.
- Muuttuja on normaalisti jaettu.
- Sekä populaation keskiarvo että keskihajonta ovat tuntemattomia molemmille populaatioille.
Näemme, että suurin osa näistä ehdoista täytetään. Meille kerrottiin, että meillä on yksinkertaisia satunnaisia näytteitä. Opiskelemassamme väestöt ovat suuret, koska näillä luokkatasoilla on miljoonia opiskelijoita.
Edellytys, jota emme voi automaattisesti olettaa, on, jos testitulokset jaetaan normaalisti. Koska meillä on riittävän suuri otoskoko, t-proseduuriemme tukevuuden vuoksi emme välttämättä tarvitse muuttujaa normaalijakaumaan.
Koska ehdot täyttyvät, suoritamme pari alustavaa laskelmaa.
Vakiovirhe
Vakiovirhe on arvio keskihajonnasta. Tätä tilastoa varten lisäämme näytteiden varianssin ja otamme sitten neliöjuuren. Tämä antaa kaavan:
(s1 2 / n1 + s22 / n2)1/2
Yllä olevia arvoja käyttämällä näemme, että vakiovirheen arvo on
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Vapauden asteet
Voimme käyttää konservatiivista lähentämistä vapauden asteet. Tämä saattaa aliarvioida vapausasteiden lukumäärän, mutta se on paljon helpompi laskea kuin käyttämällä Welchin kaavaa. Käytämme pienempää kahdesta näytteen koosta ja vähennä sitten yksi tästä luvusta.
Esimerkissämme kahdesta näytteestä pienempi on 20. Tämä tarkoittaa, että vapausasteiden lukumäärä on 20 - 1 = 19.
Hypoteesitesti
Haluamme testata hypoteesin, jonka mukaan viidennen luokan oppilaiden keskimääräinen koepistemäärä on suurempi kuin kolmannen luokan oppilaiden keskimääräisen pisteet. Olkoon μ1 olla kaikkien viidenneiden luokkijoiden keskimääräinen pistemäärä. Samoin annamme μ2 olla kaikkien kolmansien tiehöylöiden populaation keskiarvo.
Hypoteesit ovat seuraavat:
- H0: μ1 - μ2 = 0
- H: μ1 - μ2 > 0
Testitilasto on erä näytteen keskiarvojen välillä, joka jaetaan sitten vakiovirheellä. Koska arvioimme populaation keskihajontaa näytteen vakiopoikkeamilla, testitilastot t-jakaumasta.
Testitilastojen arvo on (84 - 75) / 1,2583. Tämä on noin 7.15.
Määritämme nyt, mikä p-arvo on tällä hypoteesitestillä. Tarkastellaan testitilastojen arvoa ja missä tämä sijaitsee t-jakaumalla, jolla on 19 vapausastetta. Tätä jakelua varten meillä on 4,2 x 10-7 p-arvona. (Yksi tapa selvittää tämä on käyttää T.DIST.RT-toimintoa Excelissä.)
Koska meillä on niin pieni p-arvo, hylkäämme nollahypoteesin. Johtopäätöksenä on, että viidennen luokkalaisten keskimääräiset testitulokset ovat korkeammat kuin kolmansien luokkalaisten keskimääräiset testitulokset.
Luottamusväli
Koska olemme todenneet, että keskiarvojen välillä on ero, määrittelemme nyt luottamusvälin näiden kahden keskiarvon erolle. Meillä on jo paljon mitä tarvitsemme. Erojen luottamusvälillä on oltava sekä arvio että virhemarginaali.
Arvio kahden keskiarvon erotuksesta on suoraviivainen laskea. Löydämme yksinkertaisesti erot näytteen keskiarvoissa. Tämä otoskeskiarvon ero estimoi populaatiokeskiarvon eron.
Tietojemme mukaan ero näytteen keskiarvoissa on 84 - 75 = 9.
Virhemarginaalia on hieman vaikeampi laskea. Tätä varten meidän on kerrottava sopiva tilasto vakiovirheellä. Tarvitsemme tilastot saadaan käymällä läpi taulukon tai tilastollisen ohjelmiston.
Jälleen konservatiivisen lähentämisen avulla meillä on 19 vapausastetta. 95%: n luottamusvälillä näemme, että t* = 2.09. Voisimme käyttää T.INV-toiminto Excelissäl laskeaksesi tämän arvon.
Kokoimme nyt kaiken ja huomaa, että virhemarginaalimme on 2,09 x 1,2583, joka on noin 2,63. Luotettavuusväli on 9 ± 2,63. Väli on 6,37 - 11,63 pistettä testissä, jonka viides ja kolmas luokkalaiset valitsivat.