Yksi tilastojen tavoitteista on järjestää tiedot tarkoituksenmukaisella tavalla. Kaksisuuntaiset taulukot ovat tärkeä tapa organisoida tietyn tyyppinen taulukko paritiedot. Kuten minkä tahansa kuvaajan tai taulukon rakentamisessa tilastoissa, on erittäin tärkeää tietää muuttujien tyypit, joiden kanssa työskentelemme. Jos meillä on kvantitatiivista tietoa, niin graafi, kuten a histogrammi tai varsi ja lehti juoni tulisi käyttää. Jos meillä on kategorista tietoa, sitten pylväskaavio tai ympyrädiagrammi on sopiva.
Kun työskentelemme paritietojen kanssa, meidän on oltava varovaisia. Hajakuvio on olemassa parilliselle kvantitatiiviselle tiedolle, mutta millainen kuvaaja on olemassa pariksi muodostetulle kategorinen data? Aina kun meillä on kaksi kategorista muuttujaa, meidän tulisi käyttää kaksisuuntaista taulukkoa.
Kuvaus kaksisuuntaisesta taulukosta
Ensinnäkin muistutamme, että kategorinen tieto liittyy piirteisiin tai luokkiin. Se ei ole kvantitatiivinen, eikä sillä ole numeerisia arvoja.
Kaksisuuntaiseen taulukkoon luetellaan kahden kategorisen muuttujan kaikki arvot tai tasot. Yhden muuttujan kaikki arvot on lueteltu pystysuorassa sarakkeessa. Toisen muuttujan arvot on lueteltu vaakasuuntaisella rivillä. Jos ensimmäisellä muuttujalla on m arvot ja toisella muuttujalla on n arvoja, niin siellä on yhteensä mn merkinnät taulukossa. Jokainen näistä merkinnöistä vastaa tiettyä arvoa molemmille muuttujille.
Jokaisella rivillä ja sarakkeilla merkinnät lasketaan kokonaisuudessaan. Nämä kokonaismäärät ovat tärkeitä määritettäessä marginaalista ja ehdollista jakaumaa. Nämä kokonaismäärät ovat tärkeitä myös suoritettaessa chi-neliöinen riippumattomuuden testi.
Esimerkki kaksisuuntaisesta taulukosta
Tarkastellaan esimerkiksi tilannetta, jossa tarkastellaan useita osia yliopiston tilastokurssista. Haluamme rakentaa kaksisuuntaisen taulukon selvittääkseen, mitkä ovat urosten ja naisten väliset erot, jos niitä on, kurssin aikana. Tämän saavuttamiseksi lasketaan kunkin sukupuolen jäsenten ansaitsemien kirjainluokkien lukumäärä.
Huomaamme, että ensimmäinen kategorinen muuttuja on sukupuoli, ja miehen ja naisen tutkimuksessa on kaksi mahdollista arvoa. Toinen kategorinen muuttuja on kirjainluokka, ja A, B, C, D ja F antaa viisi arvoa. Tämä tarkoittaa, että meillä on kaksisuuntainen taulukko, jossa on 2 x 5 = 10 merkintää, lisäksi ylimääräinen rivi ja ylimääräinen sarake, jota tarvitaan rivien ja sarakkeiden yhteenvetotaulukkoon.
Tutkimuksemme osoittaa, että:
- 50 urosta ansaitsi A, kun taas 60 naista ansaitsi A.
- 60 urosta sai B ja 80 naista B.
- 100 urosta sai C ja 50 naista C.
- 40 urosta ansaitsi D ja 50 naista ansaitsivat D.
- 30 urosta ansaitsi F ja 20 narttua F.
Nämä tiedot syötetään alla olevaan kaksisuuntaiseen taulukkoon. Kunkin rivin kokonaismäärä kertoo meille, kuinka monta luokkaa ansainnut. Sarakkeiden kokonaismäärät kertovat meille miehien ja naisten lukumäärän.
Kaksisuuntaisen pöydän merkitys
Kaksisuuntainen taulukko auttaa järjestämään tietomme, kun meillä on kaksi kategorista muuttujaa. Tätä taulukkoa voidaan käyttää auttamaan meitä vertaamaan tietoja eri ryhmien välillä. Voimme esimerkiksi harkita miesten suhteellista suorituskykyä tilastollisella kurssilla verrattuna naisten suorituskykyyn kurssilla.
Seuraavat vaiheet
Kaksisuuntaisen taulukon muodostamisen jälkeen seuraava vaihe voi olla tietojen analysointi tilastollisesti. Voimme kysyä, ovatko tutkimuksen muuttujat riippumattomia toisistaan vai eivät. Voit vastata tähän kysymykseen käyttämällä chi-neliötestiä kaksisuuntaisessa pöydässä.
Kaksisuuntainen taulukko luokille ja sukupuolille
Uros | Nainen | Kaikki yhteensä | |
50 | 60 | 110 | |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Kaikki yhteensä | 280 | 260 | 540 |