Mikä on käynnistyminen tilastotiedoissa?

click fraud protection

Bootstrapping on tilastollinen tekniikka, joka kuuluu laajempaan otokseen uudelleenotannasta. Tämä tekniikka sisältää suhteellisen yksinkertaisen menettelyn, mutta toistetaan niin monta kertaa, että se on suuresti riippuvainen tietokonelaskelmista. Bootstrapping tarjoaa muun menetelmän kuin luottamusvälit populaatioparametrin arvioimiseksi. Bootstrapping näyttää hyvin toimivan kuin taikuutta. Lue edelleen, kuinka se saa mielenkiintoisen nimen.

Selitys käynnistyksestä

Yksi tavoite päättelytilastot on määrittää populaation parametrin arvo. Tätä on tyypillisesti liian kallista tai jopa mahdotonta mitata suoraan. Joten me käytämme tilastollinen näytteenotto. Otetaan otos populaatiosta, mitataan tämän otoksen tilastotiedot ja sanotaan sitten tämän tilaston avulla jotain vastaava parametri väestöstä.

Esimerkiksi suklaatehtaassa saatamme taata, että karkkipatukoissa on tietty tarkoittaa paino. Jokaisen tuotetun karkkipalkin punnitseminen ei ole mahdollista, joten valitsemme näytteenottotekniikoita satunnaisesti 100 karkkipalkin valitsemiseksi. Lasketaan näiden 100 karkkipalkin keskiarvo ja sanotaan, että populaation keskiarvo on virherajoituksen sisällä siitä, mikä on näytteemme keskiarvo.

instagram viewer

Oletetaan, että muutama kuukausi myöhemmin haluamme tietää tarkemmin - tai vähemmän a virhemarginaali - mikä karkkipalkin keskimääräinen paino oli sinä päivänä, kun otettiin näytteitä tuotantolinjalta. Emme myöskään voi käyttää tämän päivän karkkipalkkeja monia muuttujia ovat tulleet kuvaan (erilaiset maito-, sokeri- ja kaakaopapuerät, erilaiset ilmasto-olosuhteet, erilaiset työntekijät linjalla jne.). Ainoa mitä meillä on kiinnostuneesta päivästä lähtien, ovat 100 painoa. Ilman aikakonetta takaisin tuohon päivään näyttää siltä, ​​että alkuperäinen virhemarginaali on paras, mitä voimme toivoa.

Onneksi voimme käyttää bootstrapping-tekniikka. Tässä tilanteessa me sattumanvaraisesti näyte korvaamalla 100 tunnetusta painosta. Kutsumme tätä sitten bootstrap-näyteksi. Koska sallimme korvaamisen, tämä käynnistyslohkonäyte ei todennäköisesti ole identtinen alkuperäisen näytteemme kanssa. Jotkut datapisteet voidaan kopioida, ja toiset alkuperäisen 100 datapisteet voidaan jättää käynnistyslohkonäytteessä. Tietokoneen avulla voidaan rakentaa tuhansia bootstrap-näytteitä suhteellisen lyhyessä ajassa.

Esimerkki

Kuten mainittiin, bootstrap-tekniikoiden todella käyttämiseksi on käytettävä tietokonetta. Seuraava numeerinen esimerkki auttaa osoittamaan prosessin toiminnan. Jos aloitamme näytteillä 2, 4, 5, 6, 6, niin kaikki seuraavat ovat mahdollisia käynnistysastanäytteitä:

  • 2 ,5, 5, 6, 6
  • 4, 5, 6, 6, 6
  • 2, 2, 4, 5, 5
  • 2, 2, 2, 4, 6
  • 2, 2, 2, 2, 2
  • 4,6, 6, 6, 6

Tekniikan historia

Bootstrap-tekniikat ovat suhteellisen uusia tilastojen alalla. Ensimmäinen käyttö julkaistiin Bradley Efronin vuonna 1979 julkaisussa. Laskentatehon lisääntyessä ja muuttuessa halvemmaksi bootstrap-tekniikat ovat yleistyneet.

Miksi nimi Bootstrapping?

Nimi “bootstrapping” tulee lauseesta “Nosta itseään bootstrapsistaan.” Tämä tarkoittaa jotakin petollista ja mahdotonta. Yritä niin kovaa kuin pystyt, et voi nostaa itseäsi ilmaan vetämällä nahkakappaleita kengilläsi.

On jokin matemaattinen teoria, joka oikeuttaa käynnistystekniikan. Bootstrappingin käyttö tuntuu kuitenkin siltä, ​​että teet mahdotonta. Vaikka ei näytä siltä, ​​että voisit parantaa väestötilastojen arviointia käyttämällä samaa otosta uudestaan ​​ja uudestaan, käynnistyksen esto voi itse asiassa tehdä tämän.

instagram story viewer