Mikä on kaltevuus tilastoissa?

Jotkut tietojen jakaumat, kuten kellokäyrä tai normaalijakauma, ovat symmetrisiä. Tämä tarkoittaa, että jakauman oikea ja vasen ovat täydellisiä peilikuvia toisistaan. Kaikki tiedon jakaumat eivät ole symmetrisiä. Tietojoukkojen, jotka eivät ole symmetrisiä, sanotaan olevan epäsymmetrisiä. Sitä, kuinka epäsymmetrinen jakauma voi olla, kutsutaan vinoutukseksi.

Keskiarvo, mediaani ja tila ovat kaikki keskuksen mitat joukko tietoja. Tietojen vinous voidaan määrittää kuinka nämä määrät ovat suhteessa toisiinsa.

Kalteva oikealle

Oikealle vääntyneillä tiedoilla on pitkä häntä, joka ulottuu oikealle. Vaihtoehtoinen tapa puhua oikealle vinoutuneesta tietojoukosta on sanoa, että se on positiivisesti vinossa. Tässä tilanteessa keskiarvo ja mediaani ovat molemmat suurempia kuin tila. Pääsääntönä on, että suurimman osan ajasta oikealle vääntyneiden tietojen keskiarvo on suurempi kuin mediaani. Yhteenvetona voidaan todeta, että oikealle vääntyneelle tietojoukolle:

  • Aina: tarkoittaa suurempi kuin tila
  • Aina: mediaani suurempi kuin tila
  • Suurimman osan ajasta: keskiarvo on suurempi kuin mediaani
instagram viewer

Kalteva vasemmalle

Tilanne kääntyy itsestään, kun käsittelemme vasemmalle vääntyneitä tietoja. Vasemmalle vääntyneillä tiedoilla on pitkä pyrstö, joka ulottuu vasemmalle. Vaihtoehtoinen tapa puhua vasemmalle vinoutuneesta tietojoukosta on sanoa, että se on negatiivisesti vinossa. Tässä tilanteessa keskiarvo ja mediaani ovat molemmat vähemmän kuin moodi. Pääsääntönä on, että suurimman osan ajasta vasemmalle vääntyneiden tietojen keskiarvo on pienempi kuin mediaani. Yhteenvetona voidaan todeta, että vasemmalle vinossa tietojoukossa:

  • Aina: tarkoittaa vähemmän kuin tilaa
  • Aina: mediaani vähemmän kuin tila
  • Suurimman osan ajasta: tarkoittaa vähemmän kuin mediaani

Kaltevuuden mitat

On yksi asia tarkastella kahta tietojoukkoa ja määrittää, että toinen on symmetrinen, kun taas toinen on epäsymmetrinen. Toinen on tarkastella kahta epäsymmetrisen datan sarjaa ja sanoa, että toinen on vinoampi kuin toinen. Voi olla erittäin subjektiivista määrittää, mikä on vinoutuneempaa yksinkertaisesti tarkastelemalla jakauman kuvaajaa. Tästä syystä on olemassa tapoja laskea numeerisesti vinous.

Yksi vinous, jota kutsutaan Pearsonin ensimmäiseksi vinokertoimeksi, on vähentää keskiarvo moodista ja jakaa tämä ero sitten keskihajonta tiedoista. Syynä eron jakamiseen on niin, että meillä on mitaton määrä. Tämä selittää, miksi oikealle vääntyneissä tiedoissa on positiivinen vinous. Jos tietojoukko on vinossa oikealle, keskiarvo on suurempi kuin tila, ja siten tilan vähentäminen keskiarvosta antaa positiivisen luvun. Samanlainen argumentti selittää, miksi vasemmalle vääntyneillä tiedoilla on negatiivinen vinous.

Pearsonin toista vinokerrointa käytetään myös mittaamaan tietojoukon epäsymmetria. Tätä määrää varten vähennämme moodin mediaanista, kerrotaan tämä luku kolmella ja jaetaan sitten keskihajonnalla.

Kaltevan datan sovellukset

Vinoa tietoa syntyy melko luonnollisesti eri tilanteissa. Tulot ovat vinoutuneet oikealle, koska jopa vain muutamat miljoonat dollarit ansaitsevat henkilöt voivat vaikuttaa suuresti keskiarvoon, eikä negatiivisia tuloja ole. Samoin tuotteen, kuten lampun merkin, käyttöikää koskevat tiedot ovat vinossa oikealle. Täällä pienin, joka elinikä voi olla, on nolla, ja pitkäikäiset hehkulamput antavat tiedon positiiviselle vinoutumiselle.