Luottamusvälit ovat yksi osa päättelytilastot. Aiheen perusajatuksena on arvioida tuntemattoman väestön arvo parametri käyttämällä tilastollista otosta. Emme voi vain arvioida parametrin arvoa, mutta voimme myös mukauttaa menetelmäämme estimoida kahden vastaavan parametrin välinen ero. Esimerkiksi saatamme ehkä löytää ero prosentuaalisen osuuden miesten yhdysvaltalaisista äänioikeudellisista väestöryhmistä, jotka tukevat tiettyä lakia, verrattuna naisten äänioikeuteen.
Nähdään, kuinka tämäntyyppinen laskenta tehdään rakentamalla luottamusväli kahden populaatiosuhteen erolle. Prosessissa tutkimme osaa tämän laskelman taustalla olevasta teoriasta. Näemme joitain samankaltaisuuksia rakennettaessa a luottamusväli yhdelle väestöosuudelle sekä a luottamusväli kahden populaatiokeskiarvon erolle.
ylimalkainen toteamus
Ennen kuin tarkastelemme tiettyä kaavaa, jota käytämme, tarkastellaan yleisiä puitteita, joihin tämäntyyppinen luottamusväli sopii. Tarkasteltavan luottamusvälin tyyppi annetaan seuraavalla kaavalla:
Arvio +/- virhemarginaali
Monet luottamusvälit ovat tämän tyyppisiä. Meidän on laskettava kaksi numeroa. Ensimmäinen näistä arvoista on parametrin arvio. Toinen arvo on virhemarginaali. Tämä virhemarginaali johtuu siitä, että meillä on arvio. Luottamusväli tarjoaa meille joukon mahdollisia arvoja tuntemattomalle parametrillemme.
olosuhteet
Meidän tulisi varmistaa ennen laskelmien tekemistä, että kaikki ehdot täyttyvät. Jotta voitaisiin löytää luottamusväli kahden populaatio-osuuden erolle, meidän on varmistettava, että seuraava pitää voimassa:
- Meitä on kaksi yksinkertaiset satunnaiset näytteet suurista populaatioista. Tässä "suuri" tarkoittaa, että populaatio on vähintään 20 kertaa suurempi kuin otoksen koko. Otoskokot merkitään n1 ja n2.
- Henkilömme on valittu toisistaan riippumattomasti.
- Jokaisessa näytteessämme on ainakin kymmenen onnistumista ja kymmenen epäonnistumista.
Jos luettelon viimeinen kohde ei ole tyytyväinen, niin voi olla olemassa kiertotapa. Voimme muokata plus-4 luottamusväli rakentaa ja hankkia vankat tulokset. Eteneessä oletamme, että kaikki edellä mainitut ehdot on täytetty.
Näytteet ja väestöosuudet
Nyt olemme valmiita rakentamaan luottamusvälin. Aloitamme arviolla väkilukuosuuksien erotuksesta. Molemmat näistä populaatiosuhteista arvioidaan otossuhteella. Nämä otososuudet ovat tilastoja, jotka saadaan jakamalla onnistumisten lukumäärä kussakin otoksessa ja jakamalla sitten vastaavalla otoksen koosta.
Ensimmäistä väestöosuutta merkitään p1. Jos näytteessä onnistumisten määrä tästä populaatiosta on K1, sitten meillä on näyteosuus K1 / n1.
Merkitsemme tätä tilastoa p̂: llä1. Luimme tämän symbolin nimellä "s1"sillä", koska se näyttää symbolilta p1 hattu päällä.
Samalla tavalla voimme laskea otossuhteen toisesta populaatiostamme. Tämän populaation parametri on p2. Jos näytteessä onnistumisten määrä tästä populaatiosta on K2, ja otossuhteemme on p̂2 = k2 / n2.
Näistä kahdesta tilastosta tulee ensimmäinen osa luottamusväliämme. Arvio p1 on p̂1. Arvio p2 on p̂2. Joten arvio erolle p1 - p2 on p̂1 - p̂2.
Näytteen jakautuminen näytteen osuuksien eron suhteen
Seuraavaksi meidän on hankittava kaava virhemarginaalille. Tätä varten harkitsemme ensin näytteen jakaminen p̂1 . Tämä on binomijakauma, jolla on todennäköisyys menestyä p1 ja n1 tutkimuksissa. Tämän jakauman keskiarvo on osuus p1. Tämän tyyppisen satunnaismuuttujan keskihajonnalla on varianssi p1 (1 - p1 )/n1.
P̂: n näytteenjako2 on samanlainen kuin p̂1 . Muuta yksinkertaisesti kaikki indeksit välillä 2 ja meillä on binomijakauma p: n keskiarvolla2 ja varianssi p2 (1 - p2 )/n2.
Tarvitsemme nyt muutamia tuloksia matemaattisista tilastoista p̂: n näytteen jakauman määrittämiseksi1 - p̂2. Tämän jakauman keskiarvo on p1 - p2. Koska varianssit laskevat yhteen, näemme, että näytteistysjakauman varianssi on p1 (1 - p1 )/n1 + p2 (1 - p2 )/n2. Jakauman keskihajonta on tämän kaavan neliöjuuri.
Meidän on tehtävä pari mukautusta. Ensimmäinen on, että kaava p̂: n keskihajonnalle1 - p̂2 käyttää tuntemattomia parametreja p1 ja p2. Tietenkin, jos tiedämme nämä arvot todella, niin se ei olisi ollenkaan mielenkiintoinen tilastollinen ongelma. Meidän ei tarvitse arvioida eroa p1 ja p2.. Sen sijaan voimme yksinkertaisesti laskea tarkan eron.
Tämä ongelma voidaan korjata laskemalla vakiovirhe eikä keskihajonta. Ainoa mitä meidän on tehtävä, on korvata populaatioosuudet otossuhteilla. Vakiovirheet lasketaan tilastojen perusteella parametrien sijasta. Vakiovirhe on hyödyllinen, koska se estimoi keskihajonnan tehokkaasti. Tämä tarkoittaa meille sitä, että meidän ei enää tarvitse tietää parametrien arvoa p1 ja p2. .Koska nämä näytteen mittasuhteet ovat tiedossa, vakiovirhe annetaan seuraavan lausekkeen neliöjuurilla:
p1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.
Toinen kohta, johon meidän on puututtava, on otantajakelun erityinen muoto. Osoittautuu, että voimme käyttää normaalia jakelua p̂: n näytteenjaon jakautumiseen1 - p̂2. Syynä tähän on jonkin verran tekninen, mutta se kuvataan seuraavassa kappaleessa.
Molemmat p̂1 ja p̂2 on näytteen jakauma, joka on binominen. Kutakin näistä binomijakaumista voidaan likimääräisesti normalisoida. Siten p̂1 - p̂2 on satunnaismuuttuja. Se muodostetaan kahden satunnaismuuttujan lineaarisena yhdistelmänä. Jokainen näistä on likimääräinen normaalijakauman avulla. Siksi p̂: n näytteenjako1 - p̂2 on myös normaalisti jaettu.
Luottamusvälin kaava
Meillä on nyt kaikki tarvittava luottamusvälin kokoamiseksi. Arvio on (p̂1 - p̂2) ja virhemarginaali on z * [p1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.]0.5. Arvo, johon syötetään z * luottaa luottamustasoon C. Yleisesti käytetyt arvot z * ovat 1,645 90%: n luotettavuudella ja 1,96: 95%: n luotettavuudella. Nämä arvot z * merkitsevät normaalin normaalijakauman osaa missä tarkalleen C Prosentti jakaumasta on välillä z * ja z *.
Seuraava kaava antaa meille luottamusvälin kahden populaatiosuhteen erolle:
(p1 - p̂2) +/- z * [p1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.]0.5