Parillinen tilastotieto, jota usein kutsutaan tilattuiksi pareiksi, viittaa väestön yksilöiden kahteen muuttujaan, jotka on kytketty toisiinsa niiden välisen korrelaation määrittämiseksi. Jotta tietojoukkoa voidaan pitää paritiedona, molempien näiden data-arvojen on oltava liitettyinä tai linkitettyinä toisiinsa, eikä niitä tule tarkastella erikseen.
Parillisen datan idea on vastakohtana yhden numeron tavanomaiseen yhdistämiseen kuhunkin datapisteeseen kuten toisessakin kvantitatiivinen tieto asettaa siten, että kuhunkin yksittäiseen datapisteeseen liittyy kaksi numeroa, jolloin saadaan kuvaaja, jonka avulla tilastotieteilijät voivat tarkkailla näiden muuttujien välistä suhdetta populaatiossa.
Tätä paritetun datan menetelmää käytetään, kun tutkimuksessa toivotaan vertailevan kahta muuttujaa väestön yksilöissä, jotta voidaan tehdä jonkinlainen johtopäätös havaitusta korrelaatiosta. Näitä datapisteitä tarkkaillessa pariliitosjärjestys on tärkeä, koska ensimmäinen numero on yhden asian mitta, kun taas toinen on jotain täysin erilaista.
Esimerkki parillisesta tiedosta
Oletetaan, että opettaja laskee kotitehtävien määrän jokaiselle opiskelijalle, jotta voidaan nähdä esimerkki pariksi muodostetusta tiedosta ilmoittautui tietylle yksikölle ja paritti tämän luvun kunkin oppilaan prosenttiosuuteen yksikkötestissä. Pari on seuraava:
- Henkilö, joka suoritti 10 tehtävää, ansaitsi 95% hänen testinsä. (10, 95%)
- Henkilö, joka suoritti viisi tehtävää, ansaitsi 80% hänen kokeessaan. (5, 80%)
- Henkilö, joka suoritti 9 tehtävää, ansaitsi 85% hänen kokeessaan. (9, 85%)
- Henkilö, joka suoritti 2 tehtävää, ansaitsi 50% hänen testinsä. (2, 50%)
- Henkilö, joka suoritti 5 tehtävää, ansaitsi 60% hänen testinsä. (5, 60%)
- Henkilö, joka suoritti 3 tehtävää, ansaitsi 70% hänen testinsä. (3, 70%)
Jokaisessa näissä pariksi muodostuvissa datasarjoissa voidaan nähdä, että tehtävien määrä on aina ensin tilattu pari, kun taas testissä ansaittu prosenttiosuus tulee toiseksi, kuten ensimmäisessä vaiheessa (10, 95%).
Vaikka näiden tietojen tilastollista analyysiä voitaisiin käyttää myös laskemaan keskimääräinen lukumäärä kotitehtävät suoritettu tai keskimääräinen testitulos, voi olla muita kysymyksiä tiedot. Tässä tapauksessa opettaja haluaa tietää, onko kotitehtävien määrän välillä mitään yhteyttä tuli sisään ja suoritti testin, ja opettajan olisi pidettävä tiedot pariksi vastatakseen tähän kysymys.
Parillisen tiedon analysointi
tilastolliset tekniikat of korrelaatio ja regressiota käytetään analysoimaan parittua dataa, jossa korrelaatiokerroin kvantisoi, kuinka tiiviisti tiedot sijaitsevat suoraa linjaa pitkin, ja mittaa lineaarisen suhteen vahvuuden.
Regressiota puolestaan käytetään useissa sovelluksissa, mukaan lukien sen määrittäminen, mikä rivi sopii parhaiten tietosarjamme. Tätä riviä voidaan puolestaan käyttää arvioimaan tai ennustamaan y arvot arvoille x jotka eivät olleet osa alkuperäistä tietojoukkoamme.
On olemassa erityyppinen kuvaaja, joka soveltuu erityisen hyvin paritiedoille, joita kutsutaan hajapisteiksi. Tässä kuvaajan tyyppi, yksi koordinaattiakseli edustaa yhtä parillisen datan määrää, kun taas toinen koordinaattiakseli edustaa toista paritetun datan määrää.
Yllä olevan datan hajautuspisteellä x-akseli merkitsisi käännettyjen tehtävien lukumäärää, kun taas y-akseli merkitsisi yksikkötestin pisteitä.