Mikä on histogrammi ja kuinka sitä käytetään?

click fraud protection

Histogrammi on eräänlainen kuvaaja, jolla on laajoja sovelluksia tilastoissa. Histogrammit tarjoavat visuaalisen tulkinnan numeerinen tieto osoittamalla arvoalueella olevien datapisteiden lukumäärän. Näitä arvoalueita kutsutaan luokiksi tai asteikkoiksi. Kussakin luokassa olevien tietojen taajuus on kuvattu palkin avulla. Mitä korkeampi palkki on, sitä suurempi data-arvojen esiintymistiheys kyseisessä laatikossa on.

Histogrammit vs. Pylväskaaviot

Ensi silmäyksellä histogrammit näyttävät hyvin samanlaisilta pylväskaaviot. Molemmat kuvaajat käyttävät pystysuoria palkkeja datan esittämiseksi. Tangon korkeus vastaa suhteellinen taajuus luokan tietomäärästä. Mitä korkeampi palkki, sitä korkeampi datan taajuus on. Mitä matalampi palkki on, sitä matalampi on datan taajuus. Mutta ulkonäkö voi olla petollinen. Juuri täällä yhtäläisyydet päättyvät kahden tyyppisiin kuvaajiin.

Syy siihen, että tällaiset kuvaajat ovat erilaisia, liittyy asiaan datan mittaustaso. Toisaalta pylväsdiagrammeja käytetään tietoihin nimellisellä mittaustasolla.

instagram viewer
Pylväskaaviot mitata kategorisen datan taajuutta, ja pylväskaavion luokat ovat näitä luokkia. Toisaalta histogrammeja käytetään tietoihin, jotka ovat vähintään ordinal tasolla mittaus. Histogrammin luokat ovat arvoalueita.

Toinen tärkeä ero pylväskaavioiden ja histogrammien välillä liittyy pylväiden tilaukseen. Pylväskaaviossa on yleinen käytäntö järjestää pylväät alenevan korkeuden mukaan. Histogrammin palkkeja ei kuitenkaan voida järjestää uudelleen. Ne on näytettävä luokkien esiintymisjärjestyksessä.

Esimerkki histogrammista

Yllä oleva kaavio näyttää meille histogrammin. Oletetaan, että neljä kolikkoa käännetään ja tulokset kirjataan. Sopivan käytön binomijakaumotaulukko tai suoraviivaiset laskelmat binomikaavalla osoittavat todennäköisyyden, että mikään pää ei näy, on 1/16, todennäköisyys, että yksi pää näyttää, on 4/16. Kahden pään todennäköisyys on 6/16. Kolmen pään todennäköisyys on 4/16. Neljän pään todennäköisyys on 1/16.

Rakennamme yhteensä viisi luokkaa, jokaisen leveys yksi. Nämä luokat vastaavat mahdollista lukumäärää: nolla, yksi, kaksi, kolme tai neljä. Jokaisen luokan yläpuolelle piirrämme pystysuoran palkin tai suorakulmion. Näiden tankojen korkeudet vastaavat todennäköisyyksiä, jotka on mainittu todennäköisyyskokeessamme, jonka aiheena on kääntää neljä kolikkoa ja laskea päät.

Histogrammit ja todennäköisyydet

Yllä oleva esimerkki ei vain osoita histogrammin rakennetta, vaan osoittaa myös sen diskreetit todennäköisyysjakaumat voidaan esittää histogrammin avulla. Itse asiassa diskreetti todennäköisyysjakauma voidaan esittää histogrammin avulla.

Konstruoidaksemme histogrammin, joka edustaa todennäköisyysjakaumaa, aloitamme valitsemalla luokat. Niiden tulisi olla todennäköisyyskokeen tuloksia. Kunkin näiden luokkien leveyden tulisi olla yksi yksikkö. Histogrammin palkkien korkeudet ovat todennäköisyydet jokaiselle tulokselle. Sellaisella tavalla rakennetun histogrammin kanssa palkkien alueet ovat myös todennäköisyyksiä.

Koska tällainen histogrammi antaa meille todennäköisyyksiä, siihen kohdistuu muutama ehto. Yksi ehto on, että vain ei-negatiivisia numeroita voidaan käyttää asteikolla, joka antaa meille histogrammin tietyn palkin korkeuden. Toinen ehto on, että koska todennäköisyys on yhtä suuri kuin pinta-ala, kaikkien tankojen pinta-alojen on oltava yhteensä yksi, joka vastaa 100%.

Histogrammit ja muut sovellukset

Histogrammin palkkien ei tarvitse olla todennäköisyyksiä. Histogrammeista on apua muilla kuin todennäköisyysalueilla. Aina kun haluamme verrata kvantitatiivisen datan esiintymistiheyttä, histogrammia voidaan käyttää kuvaamaan tietojoukkoamme.

instagram story viewer