Näytteenotto vaihtamalla tai ilman

Tilastollinen näytteenotto voidaan tehdä monella eri tavalla. Käytetyn näytteenottomenetelmätyypin lisäksi on myös toinen kysymys siitä, mitä tapahtuu satunnaisesti valitulle yksilölle. Tämä kysymys, joka syntyy näytteenoton yhteydessä, on seuraava: "Kun valitsemme yksilön ja kirjaamme tutkittavan ominaisuuden mittauksen, mitä teemme yksilön kanssa?"

On kaksi vaihtoehtoa:

  • Voimme korvata henkilön takaisin uima-altaaseen, josta olemme näytteilleet.
  • Voimme päättää, ettei henkilöä korvata.

Voimme helposti nähdä, että nämä johtavat kahteen eri tilanteeseen. Ensimmäisessä vaihtoehdossa korvaaminen jättää avoimeksi mahdollisuuden, että henkilö valitaan satunnaisesti toisen kerran. Toisessa vaihtoehdossa, jos työskentelemme ilman vaihtoa, ei ole mahdollista valita samaa henkilöä kahdesti. Näemme, että tämä ero vaikuttaa näihin näytteisiin liittyvien todennäköisyyksien laskemiseen.

Vaikutus todennäköisyyksiin

Tarkastele seuraavaa esimerkkikysymystä, jotta näemme kuinka korvauksen käsittely vaikuttaa todennäköisyyslaskelmiin. Mikä on todennäköisyys piirtää kaksi ässää a: sta

instagram viewer
tavallinen korttipakka?

Tämä kysymys on epäselvä. Mitä tapahtuu, kun piirrämme ensimmäisen kortin? Laitammeko sen takaisin kannelle vai jätetäänkö se pois?

Aloitamme todennäköisyyden laskemisesta korvaamisella. Yhteensä on neljä ässää ja 52 korttia, joten yhden ässä piirtämisen todennäköisyys on 4/52. Jos korvaamme tämän kortin ja piirtämme uudelleen, todennäköisyys on jälleen 4/52. Nämä tapahtumat ovat riippumattomia, joten kerrotaan todennäköisyydet (4/52) x (4/52) = 1/169 tai noin 0,592%.

Nyt verrataan tätä samaan tilanteeseen paitsi, että emme korvaa kortteja. Todennäköisyys piirtää ässä ensimmäiseen vetoon on edelleen 4/52. Oletetaan, että toisen kortin kohdalla ässä on jo vedetty. Meidän on nyt laskettava ehdollista todennäköisyyttä. Toisin sanoen meidän on tiedettävä, kuinka todennäköistä on vetää toinen ässä, kun otetaan huomioon, että ensimmäinen kortti on myös ässä.

Kaikista 51 kortista on jäljellä kolme ässää. Joten toisen ässän ehdollinen todennäköisyys ässä vetämisen jälkeen on 3/51. Kahden ässän vetämisen todennäköisyys ilman korvaamista on (4/52) x (3/51) = 1/221 tai noin 0,425%.

Näemme suoraan yllä olevasta ongelmasta, että sillä, mitä valitsemme korvaamiseksi, on todennäköisyyden arvoihin vaikutusta. Se voi muuttaa näitä arvoja huomattavasti.

Väestökoot

Joissakin tilanteissa näytteenotto korvaavalla tai ilman sitä ei muuta olennaisesti todennäköisyyksiä. Oletetaan, että valitsemme satunnaisesti kaksi ihmistä kaupungista, jonka väkiluku on 50 000, joista 30 000 on naisia.

Jos otamme näytteen korvaamalla, niin todennäköisyys valita naispuoli ensimmäisessä valinnassa annetaan 30000/50000 = 60%. Naisen todennäköisyys toisessa valinnassa on edelleen 60%. Todennäköisyys, että molemmat ihmiset ovat naisia, on 0,6 x 0,6 = 0,36.

Jos otamme ilman korvaamista, ensimmäinen todennäköisyys ei muutu. Toinen todennäköisyys on nyt 29999/49999 = 0,5999919998..., mikä on erittäin lähellä 60%. Todennäköisyys, että molemmat ovat naisia, on 0,6 x 0,5999919998 = 0,359995.

Todennäköisyydet ovat teknisesti erilaisia, mutta ne ovat riittävän lähellä ollakseen lähes erottamattomia. Tästä syystä, vaikka otamme näytteitä ilman korvaamista, kohtelemme monta kertaa kunkin henkilön valintaa ikään kuin se olisi riippumaton muista otoksen yksilöistä.

Muut sovellukset

On myös muita tapauksia, joissa meidän on harkittava näytteen ottamista vai ilman vaihtamista. Esimerkki tästä on Bootstrapping. Tämä tilastollinen tekniikka kuuluu uudelleennäytteistystekniikan otsikkoon.

Käynnistyksessä aloitamme väestön tilastollisella näytteellä. Käytämme sitten tietokoneohjelmistoja bootstrap-näytteiden laskemiseen. Toisin sanoen tietokone näyttää uuden mallin korvaamalla alkuperäisen näytteen.

instagram story viewer