Esimerkkejä suurimman todennäköisyyden arvioinnista

Oletetaan, että meillä on satunnainen näyte kiinnostuksen kohteena olevasta väestöstä. Meillä voi olla teoreettinen malli tapaan, jolla väestö on jaettu. Väestöä voi kuitenkin olla useita parametrit joista emme tiedä arvoja. Suurimman todennäköisyyden estimointi on yksi tapa määrittää nämä tuntemattomat parametrit.

Suurimman todennäköisyyden estimoinnin perusajatuksena on, että määritetään näiden tuntemattomien parametrien arvot. Teemme tämän siten, että maksimoidaan liittyvä liitoksen todennäköisyystiheysfunktio tai todennäköisyys massafunktio. Näemme tämän yksityiskohtaisemmin seuraavassa. Sitten lasketaan joitain esimerkkejä suurimman todennäköisyyden estimoinnista.

Vaiheet maksimaalisen todennäköisyyden arvioimiseksi

Yllä oleva keskustelu voidaan tiivistää seuraavilla vaiheilla:

Aloita näytteellä riippumattomia satunnaismuuttujia X₁, X₂,... X_n yhteisestä jakaumasta, jokaisella todennäköisyystiheysfunktio f (x; θ₁,.. .θ_K). Thetat ovat tuntemattomia parametreja.
Koska otos on riippumaton, havaitsemme todennäköisyys tietyn näytteen saamiseksi kertomalla todennäköisyydet yhteen. Tämä antaa meille todennäköisyysfunktion L (θ
instagram viewer
₁,.. .θ_K) = f (x₁ ;θ₁,.. .θ_K) f (x₂ ;θ₁,.. .θ_K)... f (x_n ;θ₁,.. .θ_K) = Π f (x_minä ;θ₁,.. .θ_K).
Seuraavaksi käytämme laskenta löytää teetan arvot, jotka maksimoivat todennäköisyysfunktion L.
Tarkemmin sanoen erotamme todennäköisyysfunktion L suhteessa θ: een, jos on yksi parametri. Jos parametreja on useita, laskemme L: n osittaiset johdannaiset jokaiselle teetaparametrille.
Jatka maksimointiprosessia asettamalla L: n johdannainen (tai osittaiset johdannaiset) nollaksi ja ratkaisemalla teeta.
Voimme sitten käyttää muita tekniikoita (kuten toinen johdannaiskoe) varmistaaksemme, että olemme löytäneet maksimiarvon todennäköisyysfunktiollemme.

esimerkki

Oletetaan, että meillä on paketti siemeniä, joista jokaisella on vakio todennäköisyys p itämisen menestys. Istutamme n näistä ja laske laskemaan itävien lukumäärä. Oletetaan, että jokainen siemen itää muista riippumatta. Kuinka määritetään parametrin suurin todennäköisyysestimaattori p?

Aloitamme huomauttamalla, että jokainen siemen on mallinnettu Bernoulli-jakaumalla, jonka menestys on s. Annoimme X on joko 0 tai 1, ja todennäköisyyden massafunktio yhdelle siemenelle on f(x; p ) = p^x(1 - p)^{1 - x}.

Otamme koostuu n eri X_minä, jokaisella kanssa on Bernoulli-jakelu. Itävät siemenet ovat X_minä = 1 ja siemenillä, jotka eivät itä, on X_minä= 0.

Todennäköisyysfunktion antaa:

L ( p ) = Π p^x_minä(1 - p)^{1 -}^x_minä

Näemme, että on mahdollista kirjoittaa todennäköisyysfunktio käyttämällä eksponenttien lakeja.

L ( p ) = p^{Σ x}_minä(1 - p)^{n -}^{Σ x}_minä

Seuraavaksi erotamme tämän funktion suhteessa p. Oletetaan, että kaikkien X_minäovat tunnettuja, ja siten ovat vakioita. Jotta voidaan erottaa todennäköisyysfunktio, meidän on käytettävä tuotesääntö ja tehosääntö:

L '( p ) = Σ x_minäp^{-1 + Σ x}_minä (1 - p)^{n -}^{Σ x}_minä- (n - Σ x_minä ) p^{Σ x}_minä(1 - p)^{n-1 -}^{Σ x}_minä

Me kirjoitamme uudelleen joitain negatiivisista eksponenteista ja olemme:

L '( p ) = (1/p) Σ x_minäp^{Σ x}_minä (1 - p)^{n -}^{Σ x}_minä- 1/(1 - p) (n - Σ x_minä ) p^{Σ x}_minä(1 - p)^{n -}^{Σ x}_minä

= [(1/p) Σ x_minä- 1/(1 - p) (n - Σ x_minä)]_minäp^{Σ x}_minä (1 - p)^{n -}^{Σ x}_minä

Nyt maksimointiprosessin jatkamiseksi asetamme tämän johdannaisen nollaksi ja ratkaisemme p:

0 = [(1/p) Σ x_minä- 1/(1 - p) (n - Σ x_minä)]_minäp^{Σ x}_minä (1 - p)^{n -}^{Σ x}_minä

Siitä asti kun p ja (1- p) ovat nollia, joita meillä on

0 = (1/p) Σ x_minä- 1/(1 - p) (n - Σ x_minä).

Kertomalla yhtälön molemmat puolet p(1- p) antaa meille:

0 = (1 - p) Σ x_minä- p (n - Σ x_minä).

Laajennamme oikeaa reunaa ja näemme:

0 = Σ x_minä- p Σ x_minä- pn + pΣ x_minä = Σ x_minä- pn.

Siten Σ x_minä= pn ja (1 / n) x_minä= s. Tämä tarkoittaa, että suurimman todennäköisyyden arvioija on p on näytteen keskiarvo. Tarkemmin sanottuna tämä on näytteen osuus itäneistä siemenistä. Tämä on täysin linjassa sen kanssa, mitä intuitio kertoisi meille. Itävien siementen osuuden määrittämiseksi on ensin tutkittava mielenkiinnon kohteena olevasta populaatiosta otettu näyte.

Vaiheet vaiheisiin

Edellä olevaan luetteloon on joitain muutoksia. Esimerkiksi, kuten olemme nähneet yllä, on tyypillisesti kannattavaa viettää aikaa käyttämällä jotakin algebraa yksinkertaistaakseen todennäköisyysfunktiota. Syynä tähän on tehdä erottelusta helpompaa.

Toinen muutos yllä olevaan luetteloon on harkita luonnollisia logaritmeja. Funktion L maksimi esiintyy samassa pisteessä kuin se tapahtuu L: n luonnolliselle logaritmille. Siten ln L: n maksimointi vastaa funktion L maksimointia.

L: n eksponentiaalisten funktioiden esiintymisen takia L: n luonnollisen logaritmin ottaminen yksinkertaistaa monesti työtämme huomattavasti.

esimerkki

Näemme kuinka käyttää luonnollista logaritmia tarkistamalla esimerkki ylhäältä. Aloitamme todennäköisyysfunktiolla:

L ( p ) = p^{Σ x}_minä(1 - p)^{n -}^{Σ x}_minä .

Käytämme sitten logaritmilakia ja näemme, että:

R ( p ) = ln L ( p ) = Σ x_minäln p + (n - Σ x_minä) ln (1 - p).

Näemme jo, että johdannainen on paljon helpompi laskea:

R '( p ) = (1/p) Σ x_minä- 1/(1 - p)(n - Σ x_minä) .

Nyt, kuten aiemmin, asetamme tämän johdannaisen nollaksi ja kerrotaan molemmat puolet p (1 - p):

0 = (1- p ) Σ x_minä- p(n - Σ x_minä) .

Me ratkaisemme p ja löydä sama tulos kuin ennen.

L (p): n luonnollisen logaritmin käyttö on hyödyllistä toisella tavalla. On paljon helpompaa laskea R (p): n toinen johdannainen varmistaaksemme, että meillä todella on maksimia pisteessä (1 / n) Σ x_minä= s.

esimerkki

Oletetaan, että meillä on satunnainen näyte X toisessa esimerkissä₁, X₂,... X_n populaatiosta, jota mallinnamme eksponentiaalisella jakautumisella. Yhden satunnaismuuttujan todennäköisyystiheysfunktio on muotoa f( x ) = θ^-1e ^-x/θ

Todennäköisyysfunktion antaa yhteinen todennäköisyystiheysfunktio. Tämä on tuote useille näistä tiheysfunktioista:

L (θ) = Π θ^-1e ^-x_minä^/θ= θ^-ne ^-Σ^x_minä^/θ

Jälleen kerran on hyödyllistä tarkastella todennäköisyysfunktion luonnollista logaritmia. Tämän erottaminen vaatii vähemmän työtä kuin todennäköisyysfunktion erottaminen:

R (θ) = ln L (θ) = ln [θ^-ne ^-Σ^x_minä^/θ]

Käytämme logaritmilakia ja saamme:

R (θ) = ln L (θ) = - n Ln θ + -Σx_minä/θ

Erotamme suhteessa θ: een ja meillä on:

R '(θ) = - n / θ + Σx_minä/θ²

Aseta tämä johdannainen nollaan ja näemme, että:

0 = - n / θ + Σx_minä/θ².

Kerro molemmat puolet θ²ja tulos on:

0 = - n θ + Σx_minä.

Käytä nyt algebraa ratkaistaksesi solve:

θ = (1 / n) Σx_minä.

Näemme tästä, että näyte tarkoittaa sitä, mikä maksimoi todennäköisyysfunktion. Parametrin θ sopivaksi mallimme tulisi olla yksinkertaisesti kaikkien havaintoidemme keskiarvo.

liitännät

On olemassa muun tyyppisiä estimaattoreita. Yksi vaihtoehtoinen estimointityyppi on nimeltään puolueeton arvioija. Tälle tyypille meidän on laskettava tilastomme odotettu arvo ja määritettävä, vastaako se vastaavaa parametria.