Mikä on tilastotietokanta?

Sisään tilastotermi "tukeva" tai "tukevuus" viittaa tilastollisen mallin, testien ja menettelyjen vahvuuteen tilastollisen analyysin erityisolosuhteiden mukaisesti, joita tutkimus toivoo saavuttavan. Koska nämä tutkimuksen ehdot täyttyvät, mallien voidaan todentaa olevan totta käyttämällä matemaattisia todisteita.

Monet mallit perustuvat ihanteellisiin tilanteisiin, joita ei ole olemassa reaaliaikaisen datan kanssa työskennellessä, ja seurauksena malli saattaa antaa oikeita tuloksia, vaikka olosuhteet eivät täyttyisi tarkasti.

Vahvat tilastot ovat siis kaikkia tilastoja, jotka tuottavat hyvää suorituskykyä, kun tiedot otetaan laajasta joukosta todennäköisyysjakaumat, joihin poikkeavuudet tai pienet poikkeamat tietyn mallin oletuksista eivät suuresti vaikuta aineisto. Toisin sanoen vankka tilastotieto on kestävä tulosten virheille.

Yksi tapa tarkkailla yleisesti pidettyä tiukkaa tilastollista menettelyä ei tarvitse olla kauempana kuin t-proseduurit, joissa käytetään hypoteesitestejä tarkimpien tilastollisten ennusteiden määrittämiseksi.

instagram viewer

T-menettelyjen noudattaminen

Tarkastellaan esimerkkiä kestävyydestä T-prosessit, joihin kuuluu luottamusväli väestön keskiarvolle, jonka populaation keskihajontaa ei tunneta, samoin kuin hypoteesitestit väestön keskiarvosta.

Käyttö t-menettelyt edellyttävät seuraavaa:

  • Tietojoukko, jonka kanssa työskentelemme, on a yksinkertainen satunnainen näyte väestöstä.
  • Väestö, josta olemme valinneet näytteen, jakautuvat normaalisti.

Käytännössä tosielämän esimerkkien kanssa tilastotieteilijöillä on harvoin väestö, joka on normaalisti jakautunut, joten kysymys muuttuu sen sijaan: ”Kuinka vankkoja olemme t-menettelyt?”

Yleensä se tila, että meillä on yksinkertainen satunnainen otos, on tärkeämpi kuin se ehto, että olemme ottaneet otoksen normaalisti jakautuneesta populaatiosta; syynä tähän on, että keskimääräinen rajalause varmistaa suunnilleen näytteen jakautumisen normaali - mitä suurempi näytteen koko on, sitä lähempänä näytteen keskimääräistä jakautumista näytteelle on normaali.

Kuinka T-menettelyt toimivat tukevina tilastoina

Joten tukevuus T-prosessit riippuvat näytteen koosta ja näytteen jakaumasta. Tähän on kiinnitettävä huomiota:

  • Jos näytteiden koko on suuri, mikä tarkoittaa, että meillä on 40 tai enemmän havaintoja, niin t-menettelytapoja voidaan käyttää jopa vääristyneissä jakaumissa.
  • Jos näytteen koko on välillä 15–40, voimme käyttää t-menetelmät mille tahansa muotoiselle jakautumiselle, ellei siinä ole poikkeamia tai suuri vinous.
  • Jos näytteen koko on alle 15, voimme käyttää T- menettelyt tiedoille, joissa ei ole poikkeamia, yksi piikki ja jotka ovat lähes symmetrisiä.

Useimmissa tapauksissa kestävyys on saatu aikaan matemaattisen tilastoinnin teknisen työn avulla, ja onneksi meidän ei tarvitse välttämättä tehdä näitä edistyneitä matemaattisia laskelmia oikein hyödyntää niitä; Meidän on vain ymmärrettävä, mitkä ovat yleiset suuntaviivat erityisen tilastomenetelmämme vahvuudelle.

T-proseduurit toimivat vankkina tilastoina, koska ne tuottavat tyypillisesti hyvät suoritukset näitä malleja kohdentamalla näytteen koon menettelyn soveltamisen perustana.