Tilastollisten tietojoukkojen alue

Tilastossa ja matematiikassa alue on ero tietojoukon enimmäis- ja vähimmäisarvojen välillä ja toimii yhtenä tietokokonaisuuden kahdesta tärkeästä piirteestä. Alueen kaava on maksimiarvo, josta on vähennetty tietojoukon vähimmäisarvo, mikä antaa tilastoitsijoille paremman käsityksen siitä, kuinka monipuolinen tietojoukko on.

Kaksi tärkeätä tietojoukon ominaisuutta ovat datan keskipiste ja datan leviäminen, ja keskipiste voi ollamitattu monin tavoin: suosituimpia näistä ovat keskiarvo, mediaani, tila ja keskitaajuus, mutta samalla tavalla on olemassa erilaisia ​​tapoja laskea, kuinka hajautettu tietojoukko on, ja helpointa ja karkeinta hajotusmittaa kutsutaan alueeksi.

Alueen laskenta on hyvin yksinkertaista. Ainoa mitä meidän on tehtävä, on löytää ero joukon suurimman data-arvon ja pienimmän data-arvon välillä. Lyhyesti sanottuna meillä on seuraava kaava: Alue = Suurin arvo - Minimi arvo. Esimerkiksi tietojoukossa 4,6,10, 15, 18 on korkeintaan 18, vähintään 4 ja alue 18-4 = 14.

Alue on erittäin karkea mittaus tietojen leviämiselle, koska se on erittäin herkkä poikkeaville, ja seurauksena on - rajoitukset todellisen tietojoukon hyödyllisyydelle tilastotieteilijöille, koska yksi data-arvo voi vaikuttaa suuresti tietokannan arvoon alue.

instagram viewer

Tarkastellaan esimerkiksi datajoukkoa 1, 2, 3, 4, 6, 7, 7, 8. Enimmäisarvo on 8, pienin on 1 ja alue on 7. Harkitse sitten samaa tietojoukkoa, vain arvon 100 mukana. Alue muuttuu nyt 100-1 = 99 jolloin yhden ylimääräisen datapisteen lisääminen vaikutti suuresti alueen arvoon. Vakiopoikkeama on toinen leviämisen mitta, joka on vähemmän herkkä poikkeaville, mutta haittana on, että keskihajonnan laskeminen on paljon monimutkaisempi.

Valikoima ei myöskään kerro meille mitään tietojoukkomme sisäisistä ominaisuuksista. Otamme huomioon esimerkiksi tietojoukot 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10, joissa tämän tietojoukon alue on 10-1 = 9. Jos vertaamme tätä sitten tietojoukkoon 1, 1, 1, 2, 9, 9, 9, 10. Täällä alue on jälleen yhdeksän, mutta tälle toiselle joukolle ja toisin kuin ensimmäisessä ryhmässä, data on ryhmitelty minimiin ja maksimiin. Muita tilastoja, kuten ensimmäinen ja kolmas kvartiili, olisi käytettävä tämän sisäisen rakenteen havaitsemiseksi.

Alue on hyvä tapa saada hyvin perustiedot siitä, kuinka hajautetut numerot tietojoukossa todella ovat, koska se on helppo laske, koska se vaatii vain aritmeettisen perusoperaation, mutta on myös muutama muu sovellus tietojoukon alueelle tilastoihin.

Alueen avulla voidaan estimoida myös toinen leviämismitta, keskihajonta. Sen sijaan, että käyisimme läpi melko monimutkainen kaava löytääksesi standardipoikkeama, voimme sen sijaan käyttää niin kutsuttua etäisyyssääntö. Alue on perustavanlaatuinen tässä laskelmassa.

Alue esiintyy myös Boxplot-kuviota, tai laatikko ja viikset juoni. Suurimmat ja vähimmäisarvot ovat molemmat graafisesti kuvaajan viskien päässä ja viiksien ja ruudun kokonaispituus on yhtä suuri kuin alue.

instagram story viewer