Yksi kysymys, jonka on aina tärkeää kysyä tilasto on, johtuuko havaittu tulos pelkästään sattumasta vai onko se tilastollisesti merkittävä?” Yksi luokka hypoteesitestit, jota kutsutaan permutaatiotestiksi, antaa meille mahdollisuuden testata tämä kysymys. Yleiskatsaus ja vaiheet tällaisesta testistä ovat:
- Jaoimme kohteemme kontrolliryhmään ja kokeelliseen ryhmään. Nollahypoteesi on, että näiden kahden ryhmän välillä ei ole eroa.
- Levitä hoito koeryhmälle.
- Mittaa hoitovaste
- Harkitse kokeellisen ryhmän kaikkia mahdollisia kokoonpanoja ja havaittua vastetta.
- Laske p-arvo havaitun vasteen perusteella suhteessa kaikkiin mahdollisiin koeryhmiin.
Tämä on permutaation pääpiirteet. Tämän ääriviivat saadaan aikaan viettämällä aikaa tarkastelemalla yksityiskohtaista esimerkkiä tällaisesta permutaatiotestistä.
esimerkki
Oletetaan, että tutkimme hiiriä. Erityisesti olemme kiinnostuneita siitä, kuinka nopeasti hiiret viimeistelevät labyrintin, jota he eivät ole koskaan tavanneet. Haluamme antaa todisteita kokeellisesta hoidosta. Tavoitteena on osoittaa, että hoitoryhmän hiiret ratkaisevat sokkeloa nopeammin kuin käsittelemättömät hiiret.
Aloitamme aiheistamme: kuusi hiirtä. Mukavuussyistä hiiriin viitataan kirjaimilla A, B, C, D, E, F. Kolme näistä hiiristä on valittava satunnaisesti kokeelliseen käsittelyyn, ja muut kolme asetetaan kontrolliryhmään, jossa koehenkilöt saavat lumelääkettä.
Seuraavaksi valitaan satunnaisesti järjestys, jossa hiiret valitaan suorittamaan sokkelo. Kaikkien hiirten sokkelin viimeistelyyn käytetty aika merkitään, ja jokaisen ryhmän keskiarvo lasketaan.
Oletetaan, että satunnaisessa valinnassamme on hiiret A, C ja E koeryhmässä, muiden hiirten kanssa plasebo kontrolliryhmä. Kun käsittely on suoritettu, valitsemme satunnaisesti järjestyksen hiirille kulkea sokkelo.
Kunkin hiiren juoksuajat ovat:
- Hiiri A ajaa kisaa 10 sekunnissa
- Hiiri B ajaa kisaa 12 sekunnissa
- Hiiri C ajaa kisaa 9 sekunnissa
- Hiiri D ajaa kisaa 11 sekunnissa
- Hiiri E ajaa kisaa 11 sekunnissa
- Hiiri F ajaa kilpailun 13 sekunnissa.
Keskimääräinen aika hiiren sokkelin suorittamiseksi koeryhmässä on 10 sekuntia. Keskimääräinen aika sokkelin suorittamiseen kontrolliryhmän henkilöillä on 12 sekuntia.
Voimme kysyä pari kysymystä. Onko hoito todella syy nopeampaan keskimääräiseen aikaan? Vai olisimmeko vain onnekkaita kontrolli- ja koeryhmän valinnassa? Hoidolla ei ehkä ole ollut vaikutusta, ja valitsimme satunnaisesti hitaammat hiiret plasebo- ja nopeammat hiiret hoidon saamiseksi. Permutaatiotesti auttaa vastaamaan näihin kysymyksiin.
hypoteesit
Permutaatiotestimme hypoteesit ovat:
- nolla hypoteesi on lausunto, jolla ei ole vaikutusta. Tätä erityistä testiä varten meillä on H0: Hoitoryhmien välillä ei ole eroa. Keskimääräinen aika kulkea sokkelo kaikille hiirille ilman hoitoa on sama kuin keskimääräinen aika kaikille hiirille, joilla on hoito.
- Vaihtoehtoinen hypoteesi on se, jota yritämme saada todisteeksi siitä. Tässä tapauksessa meillä olisi H: Kaikkien hoitoa saaneiden hiirten keskimääräinen aika on nopeampi kuin kaikkien hiirten keskimääräinen aika ilman hoitoa.
permutaatiot
Hiiriä on kuusi ja koeryhmässä on kolme paikkaa. Tämä tarkoittaa, että mahdollisten kokeellisten ryhmien lukumäärä annetaan yhdistelmien lukumäärällä C (6,3) = 6! / (3! 3!) = 20. Jäljelle jäävät henkilöt kuuluisivat kontrolliryhmään. Joten on olemassa 20 eri tapaa valita satunnaisesti yksilöitä kahteen ryhmäämme.
A: n, C: n ja E: n osoittaminen koeryhmälle tehtiin satunnaisesti. Koska sellaisia konfiguraatioita on 20, erityisillä, joilla A, C ja E on koeryhmässä, on todennäköisyys 1/20 = 5% esiintymisestä.
Meidän on määritettävä kaikki 20 tutkimuksemme yksilöiden kokeellisen ryhmän kokoonpanoa.
- Koeryhmä: A B C ja kontrolliryhmä: D E F
- Koeryhmä: A B D ja kontrolliryhmä: C E F
- Koeryhmä: A B E ja kontrolliryhmä: C D F
- Koeryhmä: A B F ja kontrolliryhmä: C D E
- Koeryhmä: A C D ja kontrolliryhmä: B E F
- Koeryhmä: A C E ja kontrolliryhmä: B D F
- Koeryhmä: A C F ja kontrolliryhmä: B D E
- Koeryhmä: A D E ja kontrolliryhmä: B C F
- Koeryhmä: A D F ja kontrolliryhmä: B C E
- Koeryhmä: A E F ja kontrolliryhmä: B C D
- Koeryhmä: B C D ja kontrolliryhmä: A E F
- Koeryhmä: B C E ja kontrolliryhmä: A D F
- Koeryhmä: B C F ja kontrolliryhmä: A D E
- Koeryhmä: B D E ja kontrolliryhmä: A C F
- Koeryhmä: B D F ja kontrolliryhmä: A C E
- Koeryhmä: B E F ja kontrolliryhmä: A C D
- Koeryhmä: C D E ja kontrolliryhmä: A B F
- Koeryhmä: C D F ja kontrolliryhmä: A B E
- Koeryhmä: C E F ja kontrolliryhmä: A B D
- Koeryhmä: D E F ja kontrolliryhmä: A B C
Katsomme sitten kutakin kokeellisten ja kontrolliryhmien kokoonpanoa. Laskemme keskiarvon jokaiselle yllä olevan luettelon 20 permutaatiolle. Esimerkiksi ensimmäisellä A: n, B: n ja C: n ajat ovat vastaavasti 10, 12 ja 9. Näiden kolmen luvun keskiarvo on 10,3333. Myös tässä ensimmäisessä permutaatiossa D: n, E: n ja F: n ajat ovat vastaavasti 11, 11 ja 13. Tämä on keskimäärin 11,6666.
Laskettuaan kunkin ryhmän keskiarvo, laskemme näiden keskiarvojen eron. Jokainen seuraavista vastaa edellä lueteltujen koe- ja kontrolliryhmien välistä eroa.
- Lumelääkehoito = 1,333333333 sekuntia
- Lumelääke - hoito = 0 sekuntia
- Lumelääke - hoito = 0 sekuntia
- Lumelääkehoito = -1,333333333 sekuntia
- Lumelääke - hoito = 2 sekuntia
- Lumelääke - hoito = 2 sekuntia
- Lumelääkehoito = 0,6666666667 sekuntia
- Lumelääkehoito = 0,6666666667 sekuntia
- Lumelääke - hoito = -0,666666667 sekuntia
- Lumelääke - hoito = -0,666666667 sekuntia
- Lumelääkehoito = 0,6666666667 sekuntia
- Lumelääkehoito = 0,6666666667 sekuntia
- Lumelääke - hoito = -0,666666667 sekuntia
- Lumelääke - hoito = -0,666666667 sekuntia
- Lumelääke - Hoito = -2 sekuntia
- Lumelääke - Hoito = -2 sekuntia
- Lumelääkehoito = 1,333333333 sekuntia
- Lumelääke - hoito = 0 sekuntia
- Lumelääke - hoito = 0 sekuntia
- Lumelääkehoito = -1,333333333 sekuntia
P-arvo
Nyt sijoitamme yllä mainitut erot kunkin ryhmän keskiarvojen välillä. Taulukoimme myös prosenttiosuuden 20 erilaisesta kokoonpanostamme, joita kukin erotus tarkoittaa. Esimerkiksi neljällä 20: sta 20: stä ei ollut eroa kontrolli- ja hoitoryhmien keskiarvojen välillä. Tämän osuus on 20% yllä mainituista 20 kokoonpanosta.
- -2, 10%
- -1,33 10%
- -0,667 20%
- 0 20%
- 0,667 20%
- 1,33 10%
- 2 10%: iin.
Tässä vertaamme tätä ilmoitusta havaittuun tulokseemme. Hiirten satunnainen valinta hoito- ja kontrolliryhmiin antoi keskimääräisen eron 2 sekunnissa. Näemme myös, että tämä ero vastaa 10% kaikista mahdollisista näytteistä. Tuloksena on, että meillä on tässä tutkimuksessa a p-arvo 10%.