Hipergeometrična porazdelitev (opredelitev, formula) - Kako izračunati?

Opredelitev hipergeometrične porazdelitve

V statistiki in teoriji verjetnosti je hipergeometrična porazdelitev v bistvu ločena porazdelitev verjetnosti, ki definira verjetnost k uspehov (tj. Nekaj ​​naključnih žrebanj za narisan objekt, ki ima določeno lastnost) v n številu žrebanj, brez kakršne koli zamenjave, iz danega velikost populacije N, ki vključuje natančno K objekte s to značilnostjo, kjer lahko žrebanje uspe ali pa ne.

Formula za verjetnost hipergeometrične porazdelitve je izpeljana z uporabo številnih elementov v populaciji, števila elementov v vzorcu, števila uspehov v populaciji, števila uspehov v vzorcu in nekaj kombinacij. Matematično je verjetnost predstavljena kot,

P = K C k * (N - K) C (n - k) / N C n

kje,

  • N = število postavk v populaciji
  • n = število postavk v vzorcu
  • K = število uspehov v populaciji
  • k = število uspehov v vzorcu

Povprečni in standardni odklon hipergeometrične porazdelitve je izražen kot,

Povprečje = n * K / N standardni odmik = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Pojasnilo

1. korak: Najprej določite skupno število predmetov v populaciji, ki je označeno z N. Na primer, število igralnih kart v krovu je 52.

2. korak: Nato določite število predmetov v vzorcu, označeno z n - na primer število kart, izvlečenih iz krova.

3. korak: Nato določite primere, ki se bodo šteli za uspehe v populaciji, in ga označuje K. Na primer, število src v celotnem krovu, ki je 13

Korak 4: Nato določite primerke, ki se bodo šteli za uspehe v izvlečenem vzorcu, in je označen s k. Npr. Število srčkov na kartah, izvlečenih iz krova.

5. korak: Končno je formula za verjetnost hipergeometrične porazdelitve izpeljana z uporabo številnih postavk v populaciji (1. korak), števila elementov v vzorcu (2. korak), števila uspehov v populacijski populaciji (3. korak) in število uspehov v vzorcu (korak 4), kot je prikazano spodaj.

P = K C k * (N - K) C (n - k) / N C n

Primeri hipergeometrične porazdelitve (z Excelovo predlogo)

Primer # 1

Vzemimo primer običajnega krova igralnih kart, kjer je naključno izžrebanih 6 kart brez nadomestitve. Določite verjetnost risanja natanko 4 rdečih kartic, npr. Diamantov ali src.

  • Glede na to je N = 52 (ker je v navadnem igralnem krogu 52 kart)
  • n = 6 (število naključno izvlečenih kart iz krova)
  • K = 26 (saj je v kompletu diamantov in srčkov po 13 rdečih kartonov)
  • k = 4 (Število rdečih kartonov, ki se štejejo za uspešne v vzorčenem vzorcu)

Rešitev:

Zato lahko verjetnost, da boste na izžrebanih 6 kart izžrebali natanko 4 karte rdečih apartmajev, izračunamo po zgornji formuli kot,

Verjetnost = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C 4 * 26 C 2 / 52 C 6

= 14950 * 325/20358520

Verjetnost bo -

Verjetnost = 0,2387 ~ 23,87%

Zato obstaja 23,87% verjetnost, da boste med narisanjem 6 naključnih kart iz običajnega krova izžrebali natanko 4 rdeče kartone.

2. primer

Vzemimo še en primer denarnice, ki vsebuje 5 računov za 100 USD in 7 računov za 1 USD. Če so naključno izbrani 4 računi, potem določite verjetnost, da boste izbrali točno 3 račune v vrednosti 100 USD.

  • Glede na to, N = 12 (število računov za 100 USD + število računov za 1 USD)
  • n = 4 (število naključno izbranih računov)
  • K = 5 (ker je 5 računov za 100 USD)
  • k = 3 (število računov za 100 USD, ki se štejejo za uspeh v izbranem vzorcu)

Rešitev:

Zato lahko verjetnost, da izberete natančno 3 račune po 100 dolarjev za naključno izbrane 4 račune, izračunamo po zgornji formuli kot,

Verjetnost = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C 1 / 12 C 4

= 10 * 7/495

Verjetnost bo -

Verjetnost = 0,1414 ~ 14,14%

Zato obstaja 14,14% verjetnost, da boste med črpanjem 4 naključnih računov izbrali točno 3 račune po 100 USD.

Ustreznost in uporaba

Koncept hipergeometrične porazdelitve je pomemben, ker omogoča natančen način določanja verjetnosti, kadar število preskušanj ni zelo veliko in da se vzorci odvzamejo iz končne populacije brez nadomestitve. Dejansko je hipergeometrična porazdelitev analogna binomski porazdelitvi, ki se uporablja, kadar je število poskusov bistveno veliko. Vendar se hipergeometrična porazdelitev pretežno uporablja za vzorčenje brez nadomestitve.

Zanimive Članki...