Hajontakaavaa tarkasteltuna on monia kysymyksiä. Yksi yleisimmistä on ihmetellä, kuinka hyvin suora viiva lähentää tietoja. Tämän ratkaisemiseksi on kuvaileva tilasto, jota kutsutaan korrelaatiokertoimeksi. Näemme kuinka laskea tämä tilasto.
Korrelaatiokerroin
korrelaatiokerroin, merkitty R, kertoo kuinka tarkkaa tietoa a scatterplot pudota suoraa linjaa pitkin. Mitä lähempänä sitä absoluuttinen arvo of R on yksi, sitä parempi, että tiedot kuvataan lineaarisella yhtälöllä. Jos R = 1 tai r = -1 sitten tietojoukko on täysin kohdistettu. Tietojoukot, joiden arvot ovat R lähellä nollaa näytä vähän tai ei suoraviivaista suhdetta.
Pitkien laskelmien vuoksi on parasta laskea R laskurin tai tilastollisen ohjelmiston avulla. Aina on kuitenkin syytä yrittää tietää, mitä laskuri tekee laskettaessa. Seuraava on prosessi korrelaatiokertoimen laskemiseksi pääasiassa käsin laskimen avulla, jota käytetään rutiininomaisiin aritmeettisiin vaiheisiin.
Laskennan vaiheet R
Aloitamme luettelemalla vaiheet korrelaatiokertoimen laskemiseen. Tiedot, joiden kanssa työskentelemme, ovat
paritiedot, joiden jokaista paria merkitään (xminä, yminä).- Aloitamme muutamalla alustavalla laskelmalla. Näiden laskelmien määrät käytetään seuraavissa vaiheissa laskelmaamme R:
- Laske x̄, tarkoittaa kaikista tietojen ensimmäisistä koordinaateista xminä.
- Laske ȳ, kaikkien tietojen toisten koordinaattien keskiarvo
- yminä.
- Laskea s x näyte keskihajonta kaikista tietojen ensimmäisistä koordinaateista xminä.
- Laskea s y kaikkien kaikkien toisten koordinaattien näytteen keskihajonta yminä.
- Käytä kaavaa (zx)minä = (xminä - x̄) / s x ja laskea standardoitu arvo jokaiselle xminä.
- Käytä kaavaa (zy)minä = (yminä – ȳ) / s y ja laskea standardoitu arvo jokaiselle yminä.
- Kerro vastaavat standardoidut arvot: (zx)minä(zy)minä
- Lisää viimeisen vaiheen tuotteet yhteen.
- Jaa summa edellisestä vaiheesta n - 1, missä n on parillisten tietojen joukossa olevien pisteiden kokonaismäärä. Kaiken tämän tulos on korrelaatiokerroin R.
Tämä prosessi ei ole kova, ja jokainen vaihe on melko rutiininen, mutta kaikkien näiden vaiheiden keruu on melko mukana. Vakiopoikkeaman laskeminen on yksinään tarpeeksi työläs. Mutta korrelaatiokertoimen laskemiseen ei sisälly vain kahta standardipoikkeamaa, vaan myös lukuisia muita operaatioita.
Esimerkki
Nähdäksesi tarkalleen kuinka R saadaan tarkastelemme esimerkkiä. Jälleen on tärkeää huomata, että käytännön sovelluksissa haluaisimme käyttää laskinta tai tilastollista ohjelmistoa laskeaksesi R meille.
Aloitamme luetelmalla paritiedot: (1, 1), (2, 3), (4, 5), (5,7). Keskiarvo x arvojen ollessa 1, 2, 4 ja 5 keskiarvo on x̄ = 3. Meillä on myös se, että ȳ = 4. - standardin poikkeama
x arvot ovat sx = 1,83 ja sy = 2.58. Seuraavassa taulukossa on yhteenveto muista tarvittavista laskelmista R. Oikeimmassa sarakkeessa olevien tuotteiden summa on 2,969848. Koska pisteitä on yhteensä neljä ja 4 - 1 = 3, jaamme tuotteiden summan 3: lla. Tämä antaa meille korrelaatiokertoimen R = 2.969848/3 = 0.989949.
Taulukko esimerkille korrelaatiokertoimen laskemisesta
x | y | zx | zy | zxzy |
---|---|---|---|---|
1 | 1 | -1.09544503 | -1.161894958 | 1.272792057 |
2 | 3 | -0.547722515 | -0.387298319 | 0.212132009 |
4 | 5 | 0.547722515 | 0.387298319 | 0.212132009 |
5 | 7 | 1.09544503 | 1.161894958 | 1.272792057 |