Mikä on näytteenotto?

Tilastollinen näytteenotto käytetään melko usein tilastoissa. Tässä prosessissa pyrimme määrittämään jotain väestöstä. Koska populaatiot ovat tyypillisesti suuria, muodostamme tilastollisen otoksen valitsemalla populaation alajoukon, jolla on ennalta määrätty koko. Tutkimalla otosta voimme käyttää päättelytilastoja määrittämään jotain väestöstä.

Tilastollinen otos kooltaan n sisältää yhden ryhmän n yksilöt tai kohteet, jotka on valittu satunnaisesti väestöstä. Tilastollisen otoksen käsitteeseen läheisesti liittyvä otantajakelu.

Näytejakauman alkuperä

Näytejakelu tapahtuu, kun muodostamme useita yksinkertainen satunnainen näyte saman koon tietystä populaatiosta. Näiden näytteiden katsotaan olevan toisistaan ​​riippumattomia. Joten jos henkilö on yhdessä näytteessä, niin sillä on sama todennäköisyys olla seuraavassa otettavassa näytteessä.

Laskemme tietyn tilaston jokaisesta otoksesta. Tämä voisi olla näyte tarkoittaa, näytteen varianssi tai näytteen osuus. Koska tilastotiedot riippuvat meistä olevasta otoksesta, jokainen otos tuottaa tyypillisesti erilaisen arvon kiinnostavalle tilastolle. Tuotettujen arvojen alue antaa meille näytteenjakauman.

instagram viewer

Keinot näytteenjakelu

Esimerkiksi tarkastelemme näytteen jakautumista keskiarvoon. Populaation keskiarvo on parametri, jota ei yleensä tunneta. Jos valitsemme näytteen, jonka koko on 100, niin tämän näytteen keskiarvo lasketaan helposti lisäämällä kaikki arvot yhteen ja jakamalla sitten datapisteiden kokonaismäärällä, tässä tapauksessa 100. Yksi näyte, jonka koko on 100, voi antaa meille keskiarvon 50. Toisen tällaisen näytteen keskiarvo voi olla 49. Toisella 51 ja toisella näytteellä voisi olla keskiarvo 50,5.

Näiden näytekeinojen jakauma antaa meille otantajakauman. Haluamme harkita enemmän kuin vain neljää näytekeinoa, kuten olemme tehneet edellä. Useilla lisää näytekeinoilla meillä olisi hyvä idea näytteen jakautuman muodosta.

Miksi me välitämme?

Näytejakaumat voivat vaikuttaa melko abstraktilta ja teoreettiselta. Niiden käytöllä on kuitenkin joitain erittäin tärkeitä seurauksia. Yksi tärkeimmistä eduista on, että eliminoimme tilastossa esiintyvän vaihtelevuuden.

Oletetaan esimerkiksi, että aloitamme populaatiolla, jonka keskiarvo on μ ja keskihajonta σ. Vakiopoikkeama antaa meille mittauksen jakauman jakautumisesta. Vertaamme tätä otantajakaumaan, joka saadaan muodostamalla yksinkertaisia ​​satunnaiskokoja n. Keskiarvon näytteen jakautumisella on edelleen keskiarvo μ, mutta keskihajonta on erilainen. Näytejakauman keskihajonnasta tulee σ / √ n.

Siksi meillä on seuraava

  • Otoskoko 4 antaa meille mahdollisuuden näytteen jakautumiseen vakiopoikkeamalla σ / 2.
  • Otoskoko 9 antaa meille mahdollisuuden näytteen jakautumiseen vakiopoikkeamalla σ / 3.
  • Otoskoko 25 antaa meille mahdollisuuden näytteen jakautumiseen vakiopoikkeamalla σ / 5.
  • Näytteen koko 100 antaa meille mahdollisuuden olla näytteen jakautumisella standardipoikkeamalla σ / 10.

Käytännössä

Tilastokäytännössä muodostamme harvoin otantajakaumia. Sen sijaan käsittelemme tilastotietoja, jotka on johdettu yksinkertaisesta satunnaiskokoisesta otoksesta n ikään kuin ne olisivat yhden pisteen vastaavaa näytteenjakelua pitkin. Tämä korostaa jälleen sitä, miksi haluamme olla suhteellisen suuria otoskokoja. Mitä suurempi otoskoko, sitä vähemmän variaatiota saamme tilastoistamme.

Huomaa, että muuta kuin keskustaa ja leviämistä, emme pysty sanomaan mitään otantajakauman muodosta. Osoittautuu, että tietyissä melko laajoissa olosuhteissa Keskirajan lause voidaan kertoa meille jotain melko hämmästyttävää näytteen jakautuman muodosta.

instagram story viewer