Suoritustesti satunnaisille sekvensseille

click fraud protection

Annetaan a tietosarja, yksi kysymys, jota saatamme ihmetellä, onko sekvenssi sattumanvaraisia ​​ilmiöitä vai ovatko tiedot sattumanvaraisia. Satunnaisuutta on vaikea tunnistaa, koska on erittäin vaikeaa yksinkertaisesti tarkastella tietoja ja päättää, tuotettiinko se vain sattumalta. Yksi menetelmä, jonka avulla voidaan määrittää, tapahtuiko sekvenssi todella sattumalta, on nimeltään ajotesti.

Ajotesti on merkitsevyystesti tai hypoteesitesti. Tämän testin menettely perustuu tietyn ominaisuuden omaavien tietojen ajoon tai sekvenssiin. Jotta ymmärtää kuinka juoksutesti toimii, meidän on ensin tutkittava ajon käsite.

Datasekvenssit

Aloitamme tarkastelemalla esimerkkiä ajoista. Harkitse seuraavaa satunnaislukujärjestystä:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

Yksi tapa luokitella nämä numerot on jakaa ne kahteen luokkaan, joko parilliseen (mukaan lukien numerot 0, 2, 4, 6 ja 8) tai parittomaan (mukaan lukien numerot 1, 3, 5, 7 ja 9). Tarkastelemme satunnaislukujen järjestystä ja merkitsemme parilliset numerot E: nä ja parittomat numerot O: na:

instagram viewer

E E O E E O O E O E E E E O E E O

Ajon on helpompi nähdä, jos kirjoitamme tämän niin, että kaikki Os: t ovat yhdessä ja kaikki Es: t ovat yhdessä:

EE O EE OO E EEEEE O EE OO

Laskemme parillisten tai parittomien lukumäärien lukumäärän ja katsomme, että datalle on yhteensä kymmenen ajonaikaa. Neljän juoksun pituus on yksi, viiden on pituus kaksi ja yhden pituus on viisi

olosuhteet

Minkä tahansa kanssa merkitsevyyskoe, on tärkeää tietää, mitkä olosuhteet ovat tarpeen testin suorittamiseksi. Ajotestiä varten pystymme luokittelemaan kunkin näytteen data-arvon kahteen luokkaan. Laskemme ajojen kokonaismäärän suhteessa kuhunkin luokkaan kuuluvien data-arvojen määrään.

Testi tulee olemaan kaksipuolinen testi. Syynä tähän on se, että liian harva ajo tarkoittaa, että satunnaisprosessista johtuvia variaatioita ja ajojen määrää ei todennäköisesti ole riittävästi. Liian monta ajoa syntyy, kun prosessi vuorottelee luokkien välillä liian usein, jotta sitä voidaan kuvata sattumalta.

Hypoteesit ja P-arvot

Jokaisella merkityskokeella on a nolla ja vaihtoehtoinen hypoteesi. Ajotestille nollahypoteesi on, että sekvenssi on satunnainen sekvenssi. Vaihtoehtoinen hypoteesi on, että näytteetiedot eivät ole sattumanvaraisia.

Tilastollinen ohjelmisto pystyy laskemaan p-arvo joka vastaa tiettyä testitilastoa. On myös taulukoita, jotka antavat kriittiset luvut tietyllä merkitsevyystaso ajojen kokonaismäärään.

Suorittaa testiesimerkin

Työskentelemme seuraavan esimerkin läpi nähdäksemme, kuinka ajotesti toimii. Oletetaan, että toimeksiantoa varten opiskelijaa pyydetään kääntämään kolikko 16 kertaa ja merkitsemään esiin tulleiden päiden ja pyrstön järjestys. Jos päädymme tähän tietojoukkoon:

H T H H H T T H T T H T H T H H

Voimme kysyä, suorittiko opiskelija todella kotitehtävänsä, vai huijasiko hän ja kirjoittaakseen sarjan H ja T, jotka näyttävät sattumanvaraisilta? Ajotesti voi auttaa meitä. Oletukset täyttyvät ajotestillä, koska tiedot voidaan luokitella kahteen ryhmään joko pääksi tai hännäksi. Jatkamme laskemalla juoksumäärät. Ryhmäryhmittelyssä näemme seuraavan:

H T HHH TT H TT H T H T HH

Tietoillemme on kymmenen juoksua, joissa seitsemän pyrstöä on yhdeksän päätä.

Nollahypoteesi on, että tiedot ovat satunnaisia. Vaihtoehto on, että se ei ole satunnainen. Jos alfa-arvot ovat yhtä suuret kuin 0,05, näemme käymällä oikeaa taulukkoa, että hylkäämme nollahypoteesin, kun ajojen lukumäärä on joko alle 4 tai suurempi kuin 16. Koska tiedoissamme on kymmenen juoksua, me ei hylätä nollahypoteesi H0.

Normaali lähentäminen

Ajotesti on hyödyllinen työkalu sen määrittämiseen, onko sekvenssi todennäköisesti satunnainen vai ei. Suurelle tietojoukolle on joskus mahdollista käyttää normaalia likiarvoa. Tämä normaali lähentäminen vaatii meitä käyttämään kunkin luokan elementtien lukumäärää ja laskemaan sitten sopivan keskiarvon ja keskihajonnan. normaalijakauma.

instagram story viewer