Hypergeometrická distribuce (definice, vzorec) - Jak vypočítat?

Definice hypergeometrické distribuce

Ve statistikách a teorii pravděpodobnosti je hypergeometrické rozdělení v zásadě zřetelným rozdělením pravděpodobnosti, které definuje pravděpodobnost úspěchů k (tj. Některá náhodná losování pro nakreslený objekt, který má určitou specifikovanou vlastnost) v žádném z tahů bez jakékoli náhrady z daného velikost populace N, která zahrnuje přesně K objekty s touto funkcí, kde může být tah úspěšný nebo může selhat.

Vzorec pro pravděpodobnost hypergeometrické distribuce je odvozen pomocí počtu položek v souboru, počtu položek ve vzorku, počtu úspěchů v souboru, počtu úspěchů ve vzorku a několika kombinací. Matematicky je pravděpodobnost vyjádřena jako,

P = K C k * (N - K) C (n - k) / N C n

kde,

  • N = počet položek v základním souboru
  • n = počet položek ve vzorku
  • K = počet úspěchů v populaci
  • k = počet úspěchů ve vzorku

Střední a standardní odchylka hypergeometrického rozdělení je vyjádřena jako,

Průměr = n * K / N standardní odchylka = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Vysvětlení

Krok 1: Nejprve určete celkový počet položek v populaci, který je označen N. Například počet hracích karet v balíčku je 52.

Krok 2: Dále určete počet položek ve vzorku, označený n - například počet karet vytažených z balíčku.

Krok 3: Dále určete instance, které budou považovány za úspěchy v populaci, a je označeno K. Například počet srdcí v celkovém balíčku, který je 13.

Krok 4: Dále určete instance, které budou považovány za úspěchy v odebraném vzorku, a je označen k. Např. Počet srdcí na kartách vylosovaných z balíčku.

Krok 5: Nakonec je vzorec pro pravděpodobnost hypergeometrického rozdělení odvozen pomocí počtu položek v populaci (krok 1), počtu položek ve vzorku (krok 2), počtu úspěchů v populaci (krok 3) a počet úspěchů ve vzorku (krok 4), jak je uvedeno níže.

P = K C k * (N - K) C (n - k) / N C n

Příklady hypergeometrické distribuce (s šablonou Excel)

Příklad č. 1

Vezměme si příklad obyčejného balíčku hracích karet, kde je náhodně losováno 6 karet bez výměny. Určete pravděpodobnost tažení přesně 4 červených karet karet, tj. Diamantů nebo srdcí.

  • Vzhledem k tomu, N = 52 (protože v běžném hracím balíčku je 52 karet)
  • n = 6 (počet karet náhodně vylosovaných z balíčku)
  • K = 26 (protože v sadě diamantů a srdcí je každá 13 červených karet)
  • k = 4 (počet červených karet, které mají být považovány za úspěšné v odebraném vzorku)

Řešení:

Pravděpodobnost tažení přesně 4 červených karet karet na vytažených 6 karet lze tedy vypočítat pomocí výše uvedeného vzorce jako,

Pravděpodobnost = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C, 4 * 26 C 2 / 52 C 6

= 14950 * 325/20358520

Pravděpodobnost bude -

Pravděpodobnost = 0,2387 ~ 23,87%

Existuje tedy 23,87% pravděpodobnost vylosování přesně 4 červených karet při vylosování 6 náhodných karet z obyčejného balíčku.

Příklad č. 2

Vezměme si další příklad peněženky, která obsahuje 5 100 $ bankovek a 7 $ 1 bankovek. Pokud jsou náhodně vybrány 4 účty, pak určete pravděpodobnost výběru přesně 3 účty 100 $.

  • Vzhledem k tomu, N = 12 (počet 100 $ bankovek + počet $ 1 bankovek)
  • n = 4 (počet náhodně vybraných účtů)
  • K = 5 (protože existuje 5 $ 100 bankovek)
  • k = 3 (počet 100 $ poukázek, které lze považovat za úspěch ve vybraném vzorku)

Řešení:

Pravděpodobnost výběru přesně 3 100 $ bankovek v náhodně vybraných 4 bankovkách lze tedy vypočítat pomocí výše uvedeného vzorce jako,

Pravděpodobnost = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C 1 / 12 C 4

= 10 * 7/495

Pravděpodobnost bude -

Pravděpodobnost = 0,1414 ~ 14,14%

Proto existuje 14,14% pravděpodobnost, že si vyberete přesně 3 účty 100 $ a vylosujete 4 náhodné účty.

Relevance a použití

Koncept hypergeometrické distribuce je důležitý, protože poskytuje přesný způsob určování pravděpodobností, když počet pokusů není příliš vysoký a že vzorky jsou odebírány z konečné populace bez náhrady. Ve skutečnosti je hypergeometrická distribuce analogická s binomickou distribucí, která se používá, když je počet pokusů podstatně velký. Hypergeometrická distribuce se však používá převážně pro odběr vzorků bez náhrady.

Zajímavé články...