Kuinka löytää sisä- ja ulko-aidat

Yksi tietojoukon ominaisuus, joka on tärkeä määrittää, on, sisältääkö se mitään poikkeavia. Poikkeavuuksia ajatellaan intuitiivisesti arvoissamme tietojoukossa, jotka eroavat suuresti suurimmasta osasta muuta tietoa. Tämä ymmärrys poikkeavuuksista on tietysti moniselitteinen. Kuinka paljon arvon tulisi poiketa muusta tiedosta, jotta sitä voidaan pitää poikkeuksellisena? Onko yksi tutkija kutsua ulkopuolista sopimaan toisen tutkijaan? Jotta saataisiin jonkin verran johdonmukaisuutta ja kvantitatiivista mittaa poikkeamien määrittämiseksi, käytämme sisä- ja ulkoaitaa.

Tietojoukon sisä- ja ulko-aidat löytyvät ensin muutamasta muusta kuvailevia tilastoja. Aloitamme laskemalla kvartiileja. Tämä johtaa kvartiilien väliseen etäisyyteen. Viimeinkin, kun nämä laskelmat ovat takana, pystymme määrittämään sisä- ja ulko-aidat.

kvartiileja

ensimmäinen ja kolmas kvartiili ovat osa viiden numeron yhteenveto kaikista kvantitatiivisista tiedoista. Aloitamme etsimällä tietojen mediaanin tai puolivälin, kun kaikki arvot on lueteltu nousevassa järjestyksessä. Arvot, jotka ovat pienempiä kuin mediaani, vastaavat noin puolta tiedoista. Löydämme tämän puolikas tietojoukon mediaanin, ja tämä on ensimmäinen kvartiili.

instagram viewer

Samalla tavoin tarkastelemme nyt tietojoukon yläosaa. Jos löydämme median tälle puolelle tiedoista, niin meillä on kolmas kvartiili. Nämä kvartiilit saavat nimensä siitä, että ne jakoivat tietojoukon neljään samankokoiseen osaan tai neljännekseen. Joten toisin sanoen noin 25% kaikista data-arvoista on pienempi kuin ensimmäinen kvartiili. Samalla tavalla noin 75% data-arvoista on vähemmän kuin kolmas kvartiili.

Kvartalien välinen alue

Seuraavaksi meidän on löydettävä interkvartelialue (IQR). Tätä on helpompi laskea kuin ensimmäistä kvartiilia q1 ja kolmas kvartiili q3. Ainoa mitä meidän on tehtävä, on ottaa näiden kahden kvartiilin ero. Tämä antaa meille kaavan:

IQR = Q3 - Q1

IQR kertoo meille, kuinka hajaantunut tietokokonaisuuden keskipitkä on.

Etsi sisä-aidat

Löydämme nyt sisä-aidat. Aloitamme IQR: llä ja kerromme tämä luku 1,5: llä. Sitten vähennämme tämän luvun ensimmäisestä kvartilista. Lisäämme tämän numeron myös kolmanteen kvartiliin. Nämä kaksi numeroa muodostavat sisäisen aidamme.

Etsi ulko-aidat

Ulkoaitojen osalta aloitamme IQR: llä ja kerromme tämä luku 3: lla. Sitten vähennämme tämän luvun ensimmäisestä kvartiilista ja lisäämme sen kolmanteen kvartiliin. Nämä kaksi numeroa ovat ulkoaitamme.

Poikkeamien havaitseminen

- harha nyt on yhtä helppoa kuin sen määrittäminen, missä tietoarvot sijaitsevat sisä- ja ulko-aidamme suhteen. Jos yksittäinen tietoarvo on äärimmäinen kuin jompikumpi ulkoaitoista, niin tämä on poikkeava, ja toisinaan sitä kutsutaan vahvaksi ulkoiseksi. Jos data-arvomme on vastaavan sisä- ja ulko-aidan välillä, niin tämä arvo on epäilty tai lievä. Näemme miten tämä toimii alla olevan esimerkin avulla.

esimerkki

Oletetaan, että olemme laskeneet tietomme ensimmäisen ja kolmannen kvartiilin, ja olemme löytäneet nämä arvot arvoihin 50 ja 60. Kvartalien välinen alue IQR = 60-50 = 10. Seuraavaksi näemme, että 1,5 x IQR = 15. Tämä tarkoittaa, että sisemmät aidat ovat 50 - 15 = 35 ja 60 + 15 = 75. Tämä on 1,5 x IQR vähemmän kuin ensimmäinen kvartiili ja enemmän kuin kolmas kvartiili.

Lasketaan nyt 3 x IQR ja katsotaan, että tämä on 3 x 10 = 30. Ulkoaidat ovat 3 x IQR: ää äärimmäisempiä kuin ensimmäinen ja kolmas kvartiili. Tämä tarkoittaa, että ulko-aidat ovat 50 - 30 = 20 ja 60 + 30 = 90.

Kaikkia data-arvoja, jotka ovat alle 20 tai suurempia kuin 90, pidetään poikkeavina. Kaikkien data-arvojen, jotka ovat välillä 29 - 35 tai välillä 75 - 90, epäillään olevan poikkeavia.

instagram story viewer