Väestövarianssi antaa viitteitä siitä, kuinka tietojoukko on levitettävä. Valitettavasti on yleensä mahdotonta tietää tarkalleen, mikä tämä populaatioparametri on. Kompensoidaksemme tietämättömyyttämme käytämme päättelytilastojen aihetta nimeltään luottamusvälit. Näemme esimerkin siitä, kuinka laskea luottamusväli populaatiovarianssille.
Luottamusvälin kaava
Kaava (1 - α): lle luottamusväli väestön variaatiosta. Annetaan seuraavalla epätasa-arvojonolla:
[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / .
Tässä n on otoksen koko, s2 on näytteen varianssi. Numero on chi-neliöjakauman piste pisteellä n -1 vapausastetta, jossa tarkalleen α / 2 käyrän alla olevasta alueesta on vasemmalla puolella . Samalla tavalla numero B on saman chi-neliöjakauman piste, jossa on tarkalleen α / 2 käyrän alla olevasta alueesta oikealla puolella B.
tunnustelut
Aloitamme tietojoukolla, jolla on 10 arvoa. Tämä data-arvojoukko saatiin yksinkertaisella satunnaisotannalla:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Tarvitaan jonkinlaista tutkittavaa tietojen analysointia osoittaakseen, että poikkeavuuksia ei ole. Rakentamalla
varsi ja lehti juoni näemme, että nämä tiedot ovat todennäköisesti jakelusta, joka on jaettu likimain normaalisti. Tämä tarkoittaa, että voimme jatkaa 95%: n luottamusvälin löytämistä väestövarianssille.Näytteen varianssi
Meidän on arvioitava populaation varianssi otoksen varianssiin, jota merkitään s2. Joten aloitamme laskemalla tämä tilastot. Pohjimmiltaan keskiarvo on neliöpoikkeamien summa keskiarvosta. Sen sijaan, että jaettaisiin summa summalla n jaamme sen n - 1.
Huomaamme, että näytteen keskiarvo on 104,2. Tätä käyttämällä saadaan neliöpoikkeamien summa keskiarvosta:
(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
Jaamme tämän summan 10 - 1 = 9, jotta saadaan näytteen varianssi 277.
Chi-Square jakelu
Nyt siirrymme chi-neliöjakeluun. Koska meillä on 10 data-arvoa, meillä on 9 vapauden asteet. Koska haluamme keskimääräisen 95% jakelustamme, tarvitsemme 2,5% molemmissa pyrstöissä. Tutkimme chi-neliötaulua tai ohjelmistoa ja näemme, että taulukkoarvot 2.7004 ja 19.023 kattavat 95% jakelun pinta-alasta. Nämä numerot ovat ja Bvastaavasti.
Meillä on nyt kaikki tarvittava ja olemme valmiita koottamaan luottamusvälin. Vasemman päätepisteen kaava on [(n - 1)s2] / B. Tämä tarkoittaa, että vasen päätepisteemme on:
(9 x 277) / 19,023 = 133
Oikea päätepiste löytyy korvaamalla B kanssa :
(9 x 277) / 2,7004 = 923
Joten olemme 95% vakuuttuneita siitä, että väestön vaihtelu on välillä 133–923.
Väestön keskihajonta
Tietysti, koska keskihajonta on varianssin neliöjuuri, tätä menetelmää voitaisiin käyttää rakentamaan luottamusväli populaation keskihajonnalle. Ainoa mitä meidän pitäisi tehdä, on ottaa päätepisteiden neliöjuuret. Tuloksena olisi 95%: n luottamusväli keskihajonta.