Mikä on kvartalien välinen etäisyyssääntö?

Kvartalien välinen etäisyyssääntö on hyödyllinen havaitsemalla poikkeavuuksia. poikkeavia havaintoja ovat yksittäisiä arvoja, jotka eivät kuulu tietojoukon yleiseen rakenteeseen. Tämä määritelmä on melko epämääräinen ja subjektiivinen, joten on hyödyllistä olla sääntö, jota sovelletaan, kun määritetään, onko datapiste todella syrjäinen - tässä kohtaa kvartiilien välinen etäisyyssääntö tulee sisään.

Mikä tahansa datajoukko voidaan kuvata sen avulla viiden numeron yhteenveto. Nämä viisi numeroa, jotka antavat sinulle tarvitsemasi tiedot mallien ja poikkeavien löytämiseksi, koostuvat (nousevassa järjestyksessä):

Nämä viisi numeroa kertovat henkilölle enemmän tiedoistaan ​​kuin numeroiden tarkasteleminen kerralla voisi tai ainakin helpottavat tätä. Esimerkiksi alue, joka on vähennetty maksimista, on yksi indikaattori datan jakautumisesta joukossa (huom. alue on erittäin herkkä poikkeaville - jos poikkeama on myös minimi tai maksimiarvo, alue ei ole tarkka esitys tietojen leveydestä aseta).

Alue olisi vaikea ekstrapoloida muuten. Samankaltainen alueen kanssa, mutta vähemmän herkkä poikkeaville on kvartiilien välinen alue.

instagram viewer
interkvartelialue lasketaan samalla tavalla kuin alue. Ainoa mitä teet löytääksesi se, on vähennä ensimmäinen kvartiili kolmannesta kvartilista:

Neljännesalueiden välinen alue osoittaa kuinka tiedot jakautuvat mediaanista. Se on vähemmän herkkä kuin etäisyys poikkeaviin, ja voi siksi olla hyödyllisempi.

Vaikka ne eivät vaikuta usein niihin paljon, kvartiilien välistä etäisyyttä voidaan käyttää poikkeamien havaitsemiseksi. Tämä tehdään seuraavien vaiheiden avulla:

Muista, että kvartsiilisääntö on vain peuklasääntö, joka yleensä pätee, mutta ei koske kaikkia tapauksia. Yleisesti ottaen sinun on aina seurattava ulkopuolista analyysiäsi tutkimalla tuloksena olevia poikkeavuuksia nähdäksesi, onko niillä järkeä. Mahdollista epäkunnioitusta, joka saadaan kvartiilien välisellä menetelmällä, olisi tutkittava koko tietokokonaisuuden yhteydessä.

Katso esimerkki neljänneskunnan alueen etäisyydestä työssä. Oletetaan, että sinulla on seuraavat tietoryhmät: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Tämän tietojoukon viiden numeron yhteenveto on vähintään = 1, ensimmäinen kvartiili = 4, mediaani = 7, kolmas kvartiili = 10 ja enintään = 17. Saatat tarkastella tietoja ja sanoa automaattisesti, että 17 on poikkeava, mutta mitä sanotaan kvartiilien välistä sääntöä?

Kerro vastauksesi nyt 1,5: llä, niin saat 1,5 x 6 = 9. Yhdeksän vähemmän kuin ensimmäinen kvartiili on 4 - 9 = -5. Tietoja ei ole vähemmän kuin tämä. Yhdeksän enemmän kuin kolmas kvartiili on 10 + 9 = 19. Mikään tieto ei ole tätä suurempi. Huolimatta siitä, että enimmäisarvo on viittä enemmän kuin lähin tietopiste, kvartiilien välinen etäisyyssääntö osoittaa, että sitä ei todennäköisesti pitäisi pitää tämän tietojoukon ulkopuolella.