Distribuce vzorkování - definice, typy a příklady

Co je distribuce vzorkování?

Distribuci vzorkování lze definovat jako rozdělení pravděpodobnosti pomocí statistik tak, že nejprve vyberete konkrétní populaci a poté použijete náhodné vzorky, které jsou čerpány z populace, tj. V zásadě se zaměřuje na šíření frekvencí souvisejících s šířením různých výsledků nebo výsledky, které mohou případně proběhnout pro konkrétní vybranou populaci.

Vysvětlení

  • Mnoho výzkumníků, akademiků, tržních stratégů atd. Jde o distribuci vzorků namísto výběru celé populace. Díky tomu je sada dat snadná a také spravovatelná. Aby to bylo jednodušší, předpokládejme, že obchodník chce provést analýzu počtu mladých jezdících na kole mezi dvěma regiony ve věkové hranici 13-18 let.
  • Za tímto účelem nebude brát v úvahu celou populaci přítomnou ve dvou regionech ve věku 13-18 let, což je prakticky nemožné, ai kdyby to bylo provedeno, je to příliš časově náročné a soubor dat není zvládnutelný . Místo toho si marketingový pracovník vezme vzorovou sadu po 200 kusech z každé oblasti a provede distribuci.
  • Průměrný počet využití jízdního kola se zde označuje jako průměr vzorku. Každý vybraný vzorek má svůj vlastní generovaný průměr a rozdělení provedené pro získaný průměrný průměr je definováno jako rozdělení vzorku. Získaná odchylka se označuje jako standardní chyba.

Příklad distribuce vzorkování

  1. Za předpokladu, že výzkumník provádí studii o vahách obyvatel konkrétního města a má pět pozorování nebo vzorků, tj. 70 kg, 75 kg, 85 kg, 80 kg a 65 kg. Obecně se má za to, že město má normální rozložení a udržuje standardní odchylku 5 kg, pokud jde o hmotnostní míry. Průměr tedy lze vypočítat jako (70 + 75 + 85 + 80 + 65) / 5 = 75 kg.
  2. Předpokládáme také, že velikost populace je obrovská; tedy přejdeme ke druhému kroku, vydělíme počet pozorování nebo vzorků 1, tj. 1/5 = 0,20. Nyní musíme vzít druhou odmocninu 0,20, což je 0,45. Druhá odmocnina se poté vynásobí směrodatnou odchylkou, tj. 0,45 * 5 = 2,25 kg. Získaná standardní chyba je tedy 2,25 kg a průměrná hodnota byla 75 kg. Tyto dva faktory lze použít k popisu rozdělení.

Typy distribuce vzorkování

# 1 - Rozdělení vzorků střední hodnoty

  • To lze definovat jako pravděpodobnostní rozpětí všech prostředků vzorků vybraných náhodně na základě pevné velikosti z konkrétní populace. Pokud se vzorky rozhodly pro normální populaci, šíření získaného průměru bude také normální vzhledem k průměru a standardní odchylce.
  • Pokud populace není normální až klidná, rozdělení prostředků bude mít tendenci se blížit normálnímu rozdělení za předpokladu, že velikost vzorku je poměrně velká.

# 2 - Rozdělení vzorkování proporce

To je primárně spojeno se statistikami obsaženými v atributech. Zde vstupuje do hry role binomické distribuce. Obecně reaguje na zákony binomické distribuce, ale jak se zvětšuje velikost vzorku, obvykle se opět stává normální distribucí.

# 3 - Studentova T-distribuce

Tento typ distribuce se používá, když výzkumník nezná směrodatnou odchylku populace nebo pokud je velikost vzorku velmi malá. Tento typ distribuce je velmi symetrický a splňuje podmínku standardní normální variace. Jak se velikost vzorku zvětšuje, rovnoměrné rozdělení T má tendenci se velmi blížit normálnímu rozdělení.

# 4 - F Distribuce

  • Když je v čitateli povinně přítomna větší rozptyl, najde distribuce F své využití, protože stupeň volnosti mění i kritické hodnoty změn F, což je použitelné pro velké i malé odchylky. To lze vypočítat z dostupných tabulek.
  • Porovnání se provádí z naměřené hodnoty F patřící do sady vzorků a hodnoty, která se vypočítá z tabulky, pokud je dřívější hodnota stejná nebo větší než hodnota tabulky, bude nulová hypotéza studie odmítnuta.

# 5 - Distribuce vzorce Chi-Square

Tento typ distribuce se používá, když datová sada zahrnuje práci s hodnotami, které zahrnují přidání čtverců. Přidá se množina čtvercových množství náležejících k rozptylu vzorků, a tak se vytvoří distribuční rozpětí, které nazýváme distribucí chí-kvadrát.

Důležitost

  • To je důležité, protože to zjednodušuje cestu ke statistickým závěrům. Kromě toho umožňuje, aby byly analytické úvahy zaměřeny spíše na statické rozdělení než na smíšené pravděpodobnostní rozpětí každé vybrané jednotky vzorku.
  • Eliminace variability přítomné ve statistice se provádí pomocí tohoto rozdělení.
  • Poskytuje nám odpověď na pravděpodobné výsledky, které se s největší pravděpodobností stanou.
  • Hrají klíčovou roli v inferenčních statistických studiích, což znamená, že hrají hlavní roli při vytváření závěrů týkajících se celé populace.

Závěr

  • To je ve statistice klíčové, protože funguje jako hlavní vodítko pro statistickou inferenci. V podstatě vedou výzkumníka, akademiky nebo statistiky o šíření frekvencí a signalizují řadu různých pravděpodobných výsledků, které lze dále označit celou populací.
  • Prvotním faktorem, který je zde zahrnut, je průměr vzorku a standardní chyba, která nám při odhadech pomůže vypočítat také distribuci vzorkování. Existují různé typy distribučních technik a na základě scénáře a datové sady se každá z nich použije.

Zajímavé články...