Se on uusimman hittielokuvan keskiyön esitys. Ihmiset rivitetään teatterin ulkopuolelle odottaen sisäänpääsyä. Oletetaan, että sinua pyydetään löytämään linjan keskipiste. Kuinka tekisit tämän?
On olemassa pari erilaista tapaa edetä tämän ongelman ratkaisemiseksi. Lopulta joudut selvittämään, kuinka monta ihmistä oli linjalla, ja ota sitten puolet siitä määrästä. Jos kokonaismäärä on parillinen, silloin linjan keskipiste olisi kahden ihmisen välillä. Jos kokonaismäärä on pariton, niin keskusta olisi yksi henkilö.
Voit kysyä: "Mitä linjan keskipisteen löytämisellä on tekemistä tilasto? "Tämä ajatus keskuksen löytämisestä on juuri sitä, mitä käytetään laskettaessa tietojoukon mediaania.
Mikä on mediaani?
Mediaani on yksi kolmesta ensisijaisesta tavasta löytää keskimääräinen tilastotiedot. Se on vaikeampi laskea kuin moodi, mutta ei niin työvoimavaltainen kuin keskiarvon laskeminen. Se on keskipiste samalla tavalla kuin ihmislinjan löytäminen. Kun tietoarvot on lueteltu nousevassa järjestyksessä, mediaani on data-arvo, jolla on sama määrä data-arvoja sen yläpuolella ja alapuolella.
Tapaus yksi: pariton määrä arvoja
Yksitoista akkua testataan, kuinka kauan ne kestävät. Niiden elinajat tunneina ilmaistaan 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Mikä on mediaani elinaika? Koska data-arvoja on pariton määrä, tämä vastaa riviä, jolla on pariton määrä ihmisiä. Keskipiste on keskiarvo.
Data-arvoja on yksitoista, joten kuudes on keskellä. Siksi keskimääräinen akunkestoaika on tämän luettelon kuudes arvo eli 105 tuntia. Huomaa, että mediaani on yksi data-arvoista.
Tapaus kaksi: Parillinen määrä arvoja
Kaksikymmentä kissoa punnitaan. Niiden painot nauloina on annettu 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Mikä on kissan mediaanipaino? Koska data-arvoja on parillinen määrä, tämä vastaa riviä parillisen määrän ihmisiä kanssa. Keskipiste on kahden keskiarvon välillä.
Tässä tapauksessa keskipiste on kymmenennen ja yhdestoista tietoarvon välillä. Mediaanin löytämiseksi lasketaan näiden kahden arvon keskiarvo ja saadaan (7 + 8) / 2 = 7,5. Tässä mediaani ei ole yksi data-arvoista.
Muita tapauksia?
Ainoat kaksi mahdollisuutta ovat parillinen tai pariton määrä data-arvoja. Joten kaksi edellä mainittua esimerkkiä ovat ainoat mahdolliset tavat laskea mediaani. Joko mediaani on keskiarvo tai mediaani on näiden kahden keskiarvo keskiarvot. Tyypillisesti tietojoukot ovat paljon suurempia kuin yllä tarkastellut, mutta mediaanin löytämisprosessi on sama kuin nämä kaksi esimerkkiä.
Poikkeavuuksien vaikutus
Keskiarvo ja tila ovat erittäin herkkiä poikkeavuuksille. Tämä tarkoittaa sitä, että ulkopuolisuuden esiintyminen vaikuttaa dramaattisesti molemmiin näihin keskuksen mittoihin. Yksi mediaanin etu on, että ulkopuoli ei vaikuta siihen niin paljon.
Tarkastele tätä ottamalla huomioon tietojoukot 3, 4, 5, 5, 6. Keskiarvo on (3 + 4 + 5 + 5 + 6) / 5 = 4,6, ja mediaani on 5. Pidä nyt sama tietojoukko, mutta lisää arvo 100: 3, 4, 5, 5, 6, 100. Selvästi 100 on ulkopuolinen, koska se on paljon suurempi kuin kaikki muut arvot. Uuden sarjan keskiarvo on nyt (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Kuitenkin uuden sarjan mediaani on 5. vaikkakin
Mediaanin soveltaminen
Edellä havainnoista johtuen mediaani on edullinen keskiarvo, kun tiedot sisältävät poikkeavuuksia. Kun tulot ilmoitetaan, tyypillinen tapa on ilmoittaa mediaanitulot. Tämä tehdään, koska pieni joukko ihmisiä, joiden tulot ovat erittäin korkeat, keskimääräiset tulot vääristyvät (ajattele Bill Gates ja Oprah).