Suhteellisen taajuuden histogrammien ymmärtäminen

click fraud protection

Sisään tilasto, on monia termejä, joilla on hienovarainen ero niiden välillä. Yksi esimerkki tästä on ero taajuus ja suhteellinen taajuus. Vaikka suhteellisille taajuuksille on monia käyttötarkoituksia, on erityisesti yksi, johon liittyy suhteellisen taajuuden histogrammi. Tämä on tyypin kuvaaja, jolla on yhteyksiä muihin tilastojen ja matemaattisten tilastojen aiheisiin.

Määritelmä

Histogrammit ovat tilastollisia kuvaajia, jotka näyttävät siltä pylväskaaviot. Tyypillisesti termi histogrammi on kuitenkin varattu määrällinen muuttujia. Histogrammin vaaka-akseli on numeroviiva, joka sisältää luokat tai tasalaatuiset astiat. Nämä säilytyslokerot ovat väliä numeroriville, josta data voi pudota, ja ne voivat koostua yhdestä numerosta (tyypillisesti erillinen tietojoukot, jotka ovat suhteellisen pieniä) tai arvoalue (suuremmille erillisille datajoukkoille ja jatkuva data).

Voimme esimerkiksi olla kiinnostuneita harkitsemaan pisteiden jakautumista 50 pisteen tietokilpailussa opiskelijaluokalle. Yksi mahdollinen tapa laatikoiden laatimiseen olisi erilainen laatikko jokaista 10 kohtaa kohden.

instagram viewer

Histogrammin pystyakseli edustaa lukumäärää tai taajuutta, joka data-arvo esiintyy kussakin lokerossa. Mitä korkeampi palkki on, sitä enemmän data-arvoja kuuluu tähän roskakoriarvojen alueeseen. Palataan esimerkkiimme, jos meillä on viisi opiskelijaa, jotka saivat yli 40 pistettä tietokilpailussa, niin 40-50: n roskaa vastaava palkki on viisi yksikköä korkea.

Taajuushistogrammin vertailu

Suhteellisen taajuuden histogrammi on tyypillisen taajuuden histogrammin pieni muutos. Sen sijaan, että käyttäisimme pystysuoraa akselia tiettyyn lokeroon kuuluvien data-arvojen laskemiseen, käytämme tätä akselia edustamaan tähän lokeroon kuuluvien data-arvojen kokonaisosuutta. Koska 100% = 1, kaikkien palkkien korkeuden on oltava 0 - 1. Lisäksi kaikkien tankojen korkeuksien suhteellisen taajuuden histogrammissa on oltava 1.

Oletetaan siis, että tarkastelemassamme käynnissä olevassa esimerkissä luokassamme on 25 opiskelijaa ja viisi on saanut yli 40 pistettä. Sen sijaan, että rakentaisimme tälle roskakorille viiden korkuisen palkin, meillä olisi palkki, jonka korkeus on 5/25 = 0,2.

Vertaamalla histogrammia suhteellisen taajuuden histogrammiin, jokaisella on samat kohdat, huomaamme jotain. Histogrammien yleinen muoto on sama. Suhteellisen taajuuden histogrammi ei korosta kunkin lokeron kokonaismäärää. Sen sijaan tämäntyyppinen kuvaaja keskittyy siihen, kuinka lokerossa olevien data-arvojen lukumäärä suhteessa muihin lokeroihin. Tapa, jolla se näyttää tämän suhteen, on prosentteina data-arvojen kokonaismäärästä.

Todennäköisyys massatoiminnot

Saatamme ihmetellä, mikä on suhteellisen taajuuden histogrammin määrittelyssä. Yksi avainsovellus koskee erillisiä satunnaismuuttujia, joissa laatikkomme leveys on yksi ja niiden keskipiste on jokainen ei-negatiivinen kokonaisluku. Tässä tapauksessa voimme määritellä kappalekohtaiset funktiot arvoilla, jotka vastaavat tankojen pystysuuntaisia ​​korkeuksia suhteellisessa taajuushistogrammissa.

Tämän tyyppistä funktiota kutsutaan todennäköisyysmassifunktioksi. Syy funktion rakentamiseksi tällä tavalla on, että funktion määrittelemällä käyrällä on suora yhteys todennäköisyys. Käyrän alla oleva alue arvoista että b on todennäköisyys, että satunnaismuuttujalla on arvo että b.

Yhteys todennäköisyyden ja käyrän alla olevan pinnan välillä on se, joka näkyy toistuvasti matemaattisissa tilastoissa. Toinen tällainen yhteys on todennäköisyysmassofunktion käyttö suhteellisen taajuuden histogrammin mallintamiseen.

instagram story viewer