Laskeminen a näyte varianssi tai keskihajonta ilmaistaan tyypillisesti murtona. Tämän murto-osan numerointi sisältää neliöpoikkeamien summan keskiarvosta. Tilastoissa, kaava tälle neliösummalle on
Σ (xminä - x̄)2
Symboli x̄ tarkoittaa tässä näytteen keskiarvoa, ja symboli Σ käskee lisäämään neliöerot (xminä - x̄) kaikille minä.
Vaikka tämä kaava toimii laskelmissa, on olemassa vastaava pikakuvauskaava, joka ei vaadi meitä ensin laskemaan näytteen keskiarvo. Tämä oikotien kaava neliösummalle on
Σ (xminä2) - (Σ xminä)2/n
Tässä muuttuja n viittaa näytteessä olevien datapisteiden määrään.
Vakiokaavan esimerkki
Tarkastelemme esimerkkiä, joka lasketaan molemmilla kaavoilla, jotta nähdään, kuinka tämä pikakuvaus toimii. Oletetaan, että näytteemme on 2, 4, 6, 8. Näytteen keskiarvo on (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Nyt laskemme kunkin datapisteen erot keskiarvolla 5.
- 2 – 5 = -3
- 4 – 5 = -1
- 6 – 5 = 1
- 8 – 5 = 3
Neliöimme nyt nämä numerot ja lisäämme ne yhteen. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.
Esimerkki oikotien kaavasta
Nyt käytämme samaa datajoukkoa: 2, 4, 6, 8 pikakuvakkeen avulla neliöiden summan määrittämiseksi. Kerroimme ensin jokaisen datapisteen ja lisäämme ne yhteen: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.
Seuraava vaihe on lisätä kaikki tiedot yhteen ja neliöida tämä summa: (2 + 4 + 6 + 8)2 = 400. Jaamme tämän datapisteiden lukumäärällä saadaksesi 400/4 = 100.
Vähennämme nyt tämän luvun 120: sta. Tämä antaa meille, että neliöpoikkeamien summa on 20. Tämä oli tarkalleen luku, jonka olemme jo löytäneet toisesta kaavasta.
Miten tämä toimii?
Monet ihmiset hyväksyvät vain kaavan nimellisarvoltaan, eikä heillä ole aavistustakaan, miksi tämä kaava toimii. Käyttämällä vähän algebraa voidaan nähdä, miksi tämä oikotiekaava vastaa standardia, perinteistä tapaa laskea neliöpoikkeamien summa.
Vaikka tosielämän tietojoukossa voi olla satoja, ellei jopa tuhansia arvoja, oletetaan, että data-arvoja on vain kolme: x1, x2, x3. Täällä näkemämme voitaisiin laajentaa tietojoukkoon, jolla on tuhansia pisteitä.
Aloitamme huomauttamalla, että (x1 + x2 + x3) = 3 x̄. Lause Σ (xminä - x̄)2 = (x1 - x̄)2 + (x2 - x̄)2 + (x3 - x̄)2.
Käytämme nyt perusalgebran tosiasiaa, että (a + b)2 = a2 + 2ab + b2. Tämä tarkoittaa, että (x1 - x̄)2 = x12 -2x1 x̄ + x̄2. Teemme tämän summituksen kahdella muulla ehdolla, ja meillä on:
x12 -2x1 x̄ + x̄2 + x22 -2x2 x̄ + x̄2 + x32 -2x3 x̄ + x̄2.
Järjestämme tämän uudelleen ja meillä on:
x12+ x22 + x32+ 3x̄2 - 2x̄ (x1 + x2 + x3) .
Kirjoittamalla (x1 + x2 + x3) = 3x̄ yllä olevasta tulee:
x12+ x22 + x32 - 3x̄2.
Nyt 3x̄2 = (x1+ x2 + x3)2/ 3, kaavastamme tulee:
x12+ x22 + x32 - (x1+ x2 + x3)2/3
Ja tämä on erityinen tapaus yleiskaavasta, joka mainittiin edellä:
Σ (xminä2) - (Σ xminä)2/n
Onko se todella pikakuvake?
Ei voi vaikuttaa siltä, että tämä kaava on todella pikakuvake. Loppujen lopuksi näyttää siltä, että yllä olevassa esimerkissä on yhtä paljon laskelmia. Osa tästä liittyy siihen tosiseikkaan, että tarkastelimme vain pienen otoksen kokoa.
Kun lisäämme otoksen kokoa, näemme, että pikakuvake vähentää laskelmien lukumäärää noin puoleen. Meidän ei tarvitse vähentää keskiarvoa jokaisesta datapisteestä ja tuloittaa sitten neliö. Tämä vähentää huomattavasti operaatioiden kokonaismäärää.