Mikä on pienimmän neliösumman regressioviiva?

Hajakuvio on kuvaajatyyppi, jota käytetään edustamaan paritiedot. Selittävä muuttuja on piirretty vaaka-akselia pitkin ja vastemuuttuja on piirretty pystyakselia pitkin. Yksi syy tämän tyyppisen kuvaajan käyttöön on etsiä suhteita muuttujien välillä.

Tyypillisin kaava, jota etsitään pariksi muodostetusta datajoukosta, on suora. Kaikkien kahden pisteen kautta voimme vetää suoran. Jos hajotuspisteessä on enemmän kuin kaksi pistettä, emme useimmiten voi enää vetää viivaa, joka kulkee jokaisen pisteen läpi. Sen sijaan piirrämme viivan, joka kulkee pisteiden keskellä ja näyttää datan yleisen lineaarisen trendin.

Kun tarkastelemme kuvaajamme pisteitä ja haluamme vetää viivan näiden pisteiden läpi, herää kysymys. Minkä viivan meidän pitäisi piirtää? Voidaan vetää ääretön määrä viivoja. Pelkästään silmiämme käyttämällä on selvää, että jokainen hajapiirrosta tarkasteleva ihminen voisi tuottaa hieman erilaisen linjan. Tämä epäselvyys on ongelma. Haluamme, että kaikilla on selkeästi määritelty tapa saada sama linja. Tavoitteena on saada matemaattisesti tarkka kuvaus siitä, mikä viiva tulisi vetää. Pienimmät neliöt

instagram viewer

regressioviiva on yksi tällainen viiva tietopisteidemme kautta.

Pienimmät neliöt

Pienimmän neliösumman rivin nimi selittää mitä se tekee. Aloitamme pistekokoelmalla, jonka koordinaatit ovat (x_minä, y_minä). Mikä tahansa suora viiva kulkee näiden pisteiden välillä ja menee joko näiden ylä- tai alapuolelle. Voimme laskea etäisyydet näistä pisteistä viivaan valitsemalla arvon x ja vähennetään sitten havaittu y tätä vastaava koordinaatti x alkaen y linjamme koordinaatti.

Eri linjat saman pistejoukon läpi antaisivat erilaisia etäisyyksiä. Haluamme näiden etäisyyksien olevan niin pienet kuin pystymme niistä tekemään. Mutta siinä on ongelma. Koska etäisyytemme voivat olla joko positiivisia tai negatiivisia, kaikkien näiden etäisyyksien summa kokonaan poistaa toisensa. Etäisyyksien summa on aina nolla.

Ratkaisu tähän ongelmaan on poistaa kaikki negatiiviset luvut neliöimällä pisteiden ja viivan väliset etäisyydet. Tämä antaa kokoelman ei-negatiivisia numeroita. Tavoite, joka meillä oli löytää parhaiten sopiva linja, on sama kuin tehdä näiden neliömatkojen summa mahdollisimman pieneksi. Calculus tulee pelastamaan täällä. Laskennassa tapahtuva erotteluprosessi tekee mahdolliseksi minimoida ruutuetäisyyksien summa tietystä juovasta. Tämä selittää nimessämme ilmauksen “vähiten neliöt” tälle riville.

Paras istuvuus

Koska pienimmän neliösumman viiva minimoi linjan ja pisteiden väliset neliöetäisyydet, voimme ajatella tätä viivaa datana, joka sopii parhaiten tietoihimme. Siksi pienimmän neliösumman viivaa kutsutaan myös parhaiten sopivaksi viivaksi. Kaikista mahdollisista viivoista, joita voidaan piirtää, pienimmän neliösumman viiva on lähinnä tietojoukkoa kokonaisuutena. Tämä voi tarkoittaa, että linjamme missaa osuvansa mihinkään tietojoukkomme pisteisiin.

Pienimmän neliön linjan ominaisuudet

Jokaisella pienimmän neliösumman linjalla on muutama ominaisuus. Ensimmäinen mielenkiintoinen aihe liittyy linjamme rinteeseen. Rinteellä on yhteys korrelaatiokerroin tiedoistamme. Itse asiassa viivan kaltevuus on yhtä suuri kuin r (s_y/ s_x). Tässä s_x tarkoittaa standardin poikkeamaa x koordinaatit ja s_y - standardipoikkeama y tietomme koordinaatit. Korrelaatiokertoimen merkki liittyy suoraan pienimmän neliösumman viivan alamäen merkkiin.

Toinen pienimmän neliösumman viivan ominaisuus koskee pistettä, jonka se kulkee. Samalla kun y Pienimmän neliösumman viivan sieppaaminen ei ehkä ole mielenkiintoista tilastolliselta kannalta, on yksi piste, joka on. Jokainen pienimmän neliön viiva kulkee datan keskipisteen läpi. Tällä keskipisteellä on x koordinoida, että on tarkoittaa n x arvot ja a y koordinaatti, joka on y arvot.