mediaani Datajoukon arvo on keskipiste, jossa tarkalleen puolet data-arvoista on pienempi tai yhtä suuri kuin mediaani. Samalla tavalla voimme ajatella a: n mediaania jatkuvatodennäköisyysjakauma, mutta sen sijaan, että löydettäisimme keskiarvon tietojoukosta, löydämme jakauman keskikohdan toisella tavalla.
Todennäköisyystiheysfunktiolla oleva kokonaispinta-ala on 1, joka edustaa 100%, ja seurauksena puolet tästä voi olla edustaa puolta tai 50 prosenttia. Yksi matemaattisten tilastojen suurimmista ideoista on, että todennäköisyyttä edustaa pintakäyrän käyrän alla oleva alue tiheysfunktio, joka lasketaan integraalilla, ja siten jatkuvan jakauman mediaani on kohta oikea numero linja, jossa tarkalleen puolet alueesta sijaitsee vasemmalla.
Seuraava epäasianmukainen integraali voi ilmaista tämän tiiviimmin. Jatkuvan satunnaismuuttujan mediaani X tiheysfunktiolla f( x) on arvo M sellainen, että:
0.5=∫m−∞f(x)dx
Eksponentiaalisen jakautumisen mediaani
Lasketaan nyt eksponentiaalijakauman Exp (A) mediaani. Tämän jakauman satunnaismuuttujalla on tiheysfunktio f(x) = e-x/ A/ A x mikä tahansa ei-negatiivinen reaaliluku. Toiminto sisältää myös matemaattinen vakio e, suunnilleen yhtä suuri kuin 2,71828.
Koska todennäköisyystiheysfunktio on nolla mille tahansa negatiiviselle arvolle x, kaikki mitä meidän on tehtävä on integroida seuraava ja ratkaista M: lle:
0,5 = -0 M f (x) dx
Koska integraali ∫ e-x/ A/ A dx = -e-x/ A, tulos on se
0,5 = -e-M / A + 1
Tämä tarkoittaa, että 0,5 = e-M / A ja kun olemme ottaneet yhtälön molemmin puolin luonnollisen logaritmin, meillä on:
ln (1/2) = -M / A
Koska 1/2 = 2-1, logaritmien ominaisuuksien perusteella kirjoitamme:
- ln2 = -M / A
Kertomalla molemmat puolet A: lla saadaan tulos, että mediaani M = A ln2.
Keskimääräinen eriarvoisuus tilastoissa
Tämän tuloksen yksi seuraus tulisi mainita: eksponentiaalisen jakauman keskiarvo Exp (A) on A, ja koska ln2 on pienempi kuin 1, seuraa, että tuote Aln2 on pienempi kuin A. Tämä tarkoittaa, että eksponentiaalijakauman mediaani on pienempi kuin keskiarvo.
Tämä on järkevää, jos ajatellaan todennäköisyystiheysfunktion kuvaajaa. Pitkän pyrstön takia tämä jakauma on vinossa oikealle. Monta kertaa, kun jakauma on vinossa oikealle, keskiarvo on mediaanin oikealla puolella.
Tämä tarkoittaa tilastollisen analyysin kannalta sitä, että voimme usein ennustaa, että keskiarvo ja mediaani eivät ole suoraan korreloivat ottaen huomioon todennäköisyys, että data on vinoutunut oikealle, mikä voidaan ilmaista epäsyvyyden mediaani-keskiarvona tunnetaan Tšebyshevin epätasa-arvo.
Esimerkiksi harkitse tietojoukkoa, jonka mukaan henkilö vastaanottaa yhteensä 30 kävijää 10 tunnissa, jolloin vierailijan keskimääräinen odotusaika on 20 minuuttia, vaikka tietyt tiedot voivat osoittaa, että mediaaniodotusaika olisi välillä 20–30 minuuttia, jos yli puolet vierailijoista tulisi viiden ensimmäisen joukossa tuntia.