Keskipoikkeama ja etäisyys ovat molemmat mitat tietojoukon leviäminen. Jokainen numero kertoo meille omalla tavallaan kuinka etäisyys tiedoista on, koska ne molemmat ovat variaation mitta. Vaikka näiden välillä ei ole nimenomaista suhdetta etäisyys ja keskihajonta, Tuolla on nyrkkisääntö siitä voi olla hyötyä näiden kahden tilastotiedon suhteessa. Tätä suhdetta kutsutaan joskus keskihajonnan etäisyyssääntöksi.
Alueen sääntö kertoo meille, että näytteen keskihajonta on suunnilleen yhtä suuri kuin neljäsosa data-alueesta. Toisin sanoens = (Suurin - minimi) / 4. Tämä on erittäin yksinkertainen kaava käytettäväksi, ja sitä tulisi käyttää vain erittäin karkeana arvio keskihajonnasta.
Esimerkki
Tarkastelemme seuraavaa esimerkkiä nähdäksesi esimerkin etäisyyssäännön toiminnasta. Oletetaan, että aloitamme arvoilla 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Näillä arvoilla on a tarkoittaa 17 ja keskihajonta noin 4,1. Jos sen sijaan laskem ensin tietomme alue 25: ksi - 12 = 13 ja jaa sitten tämä luku neljällä. Arvioimme keskihajonnan arvoksi 13/4 = 3,25. Tämä luku on suhteellisen lähellä todellista keskihajontaa ja hyvä karkealle arviolle.
Miksi se toimii?
Vaikuttaa siltä, että etäisyyssääntö on vähän outo. Miksi se toimii? Eikö ole täysin mielivaltaista jakaa alue vain neljällä? Miksi emme jaa toisella luvulla? Kulissien takana tapahtuu tosiasiallisesti jokin matemaattinen perustelu.
Muista kellokäyrä ja todennäköisyydet a: sta normaali normaalijakauma. Yksi ominaisuus liittyy tietyn määrän standardipoikkeamien sisältämään tietomäärään:
- Noin 68% tiedoista on yhden standardipoikkeaman (korkeampi tai alempi) keskiarvosta.
- Noin 95% tiedoista on kahden standardipoikkeaman (korkeamman tai pienemmän) keskiarvosta.
- Noin 99% on kolmen keskihajonnan sisällä (korkeampi tai alempi) keskiarvosta.
Lukumäärä, jota käytämme, liittyy 95%: iin. Voimme sanoa, että 95% kahdesta keskipisteen alapuolella olevasta standardipoikkeamasta keskiarvon yläpuolella oleviin kahteen standardipoikkeamaan, meillä on 95% tiedoista. Siten melkein kaikki normaalijakaumasi venyisi linjasegmentin yli, joka on yhteensä neljä vakiopoikkeamaa.
Kaikki tiedot eivät ole normaalisti jakautuneita ja kellokäyrän muotoisia. Mutta suurin osa tiedoista on riittävän hyvin käyttäytyviä, että kahden standardipoikkeaman siirtyminen keskiarvosta kaappaa melkein kaiken datan. Arvioimme ja sanomme, että neljä keskihajontaa ovat suunnilleen alueen koko, ja siten alue, joka jaettuna neljällä, on karkea likiarvo standardipoikkeamalle.
Käyttöalueen sääntöä varten
Alueen sääntö on hyödyllinen monissa asetuksissa. Ensinnäkin se on erittäin nopea arvio standardipoikkeamasta. Vakiopoikkeama vaatii meitä ensin löytämään keskiarvon, sitten vähentämään tämän keskiarvon jokaisesta datapisteestä, neliöstä erot, lisää nämä, jaa yhdellä vähemmän kuin datapisteiden lukumäärä, sitten (viimein) ota neliö root. Toisaalta, etäisyyssääntö vaatii vain yhden vähennyksen ja yhden jaon.
Muita paikkoja, joista etäisyyssääntö on hyödyllinen, on, kun meillä on puutteellisia tietoja. Tällaiset kaavat, kuten näytteen koon määrittämiseksi, vaativat kolme osaa tietoa: haluttu virhemarginaali, luottamustaso ja tutkittavan väestön keskihajonta. Monta kertaa on mahdotonta tietää mitä väestö on keskihajonta On. Alueen säännön avulla voimme arvioida tämän tilastotiedon ja tietää sitten, kuinka suuri meidän pitäisi tehdä otoksemme.