Normaali datanjakelu on sellainen, jossa suurin osa datapisteistä on suhteellisen samankaltaisia, tarkoittaen, että ne esiintyvät pienellä arvoalueella, jolloin vähemmän poikkeavia on dataväli.
Kun dataa jaetaan normaalisti, piirtämällä se kuvaajalle saadaan kellomainen ja symmetrinen kuva, jota usein kutsutaan kellokäyräksi. Tällaisessa tiedonjaossa keskiarvo, mediaani ja tila ovat kaikki samaa arvoa ja vastaavat käyrän huippua.
Yhteiskuntatieteessä normaali jakauma on kuitenkin enemmän teoreettista ideaalia kuin yhteistä todellisuutta. Sen käsite ja soveltaminen linssiksi, jonka avulla tietoa voidaan tutkia, on hyödyllinen työkalu tunnistamiseen ja normien visualisointi ja trendit tietojoukossa.
Normaalijakauman ominaisuudet
Yksi normaalin jakauman näkyvimmistä ominaisuuksista on sen muoto ja täydellinen symmetria. Jos taitat kuvan normaalijakaumasta täsmälleen keskelle, saat kaksi yhtä suuret puolikkaat, molemmat toistensa peilikuvan. Tämä tarkoittaa myös sitä, että puolet tietojen havainnoista kuuluu molemmin puolin jakauman keskikohtaa.
Normaalijakauman keskipiste on piste, jolla on suurin taajuus, eli luku tai vastekategoria, jolla on eniten havaintoja kyseiselle muuttujalle. Normaalijakauman keskipiste on myös kohta, johon kolme mittaa putoavat: keskiarvo, mediaani ja tila. Täysin normaalijakaumassa nämä kolme mittaa ovat kaikki sama numero.
Kaikissa normaalissa tai melkein normaalijakaumissa käyrän alla olevasta pinta-alasta on vakio suhteessa keskiarvon ja tietyn etäisyyden keskiarvoon mitattuna keskihajontayksiköt. Esimerkiksi kaikissa normaalikäyrissä 99,73 prosenttia kaikista tapauksista on kolmen standardipoikkeaman keskiarvosta, 95,45 prosenttia kaikki tapaukset ovat kahden standardipoikkeaman keskiarvosta, ja 68,27 prosenttia tapauksista on yhden standardipoikkeaman keskiarvosta tarkoittaa.
Normaalijakaumat esitetään usein standardipisteissä tai Z-pisteissä, jotka ovat lukuja, jotka kertovat todellisen pistemäärän ja keskiarvon välisen etäisyyden keskihajontana. Normaalin normaalijakauman keskiarvo on 0,0 ja keskihajonta 1,0.
Esimerkkejä ja käyttö yhteiskuntatieteissä
Vaikka normaali jakauma on teoreettinen, tutkijoiden tutkimuksen mukaan on olemassa useita muuttujia, jotka muistuttavat läheisesti normaalia käyrää. Esimerkiksi standardisoidut testitulokset, kuten SAT, ACT ja GRE, muistuttavat tyypillisesti normaalia jakaumaa. Tietyn väestön korkeus, urheilukyky ja lukuisat sosiaaliset ja poliittiset asenteet muistuttavat tyypillisesti kellokäyrää.
Normaalijakauman ideaali on hyödyllinen myös vertailukohteena, kun dataa ei normaalisti jaeta. Esimerkiksi useimmat ihmiset olettavat, että kotitalouksien tulonjako Yhdysvalloissa olisi normaalia jakautumista ja muistuttaisi kellokäyrää, kun piirretään kuvaajalle. Tämä tarkoittaisi sitä, että suurin osa Yhdysvaltain kansalaisista ansaitsee keskitulotason, toisin sanoen, että siellä on terve keskiluokka. Sillä välin alempien taloudellisten luokkien lukumäärät olisivat pienet, kuten myös ylemmien luokkien lukumäärät. Kotitalouksien tulojen todellinen jakautuminen Yhdysvalloissa ei kuitenkaan muistuta kellokäyrää. Suurin osa kotitalouksista kuuluu alhaalta keskimmäiseen alueeseen, eli köyhiä ihmisiä, jotka kamppailevat selviytyäkseen, on enemmän kuin ihmisiä, jotka elävät mukavaa keskiluokkaa. Normaalijakauman ideaali on tässä tapauksessa hyödyllinen tuloeron epätasa-arvoisuuden havainnollistamiseksi.