Co je distribuce vzorkování?
Distribuci vzorkování lze definovat jako rozdělení pravděpodobnosti pomocí statistik tak, že nejprve vyberete konkrétní populaci a poté použijete náhodné vzorky, které jsou čerpány z populace, tj. V zásadě se zaměřuje na šíření frekvencí souvisejících s šířením různých výsledků nebo výsledky, které mohou případně proběhnout pro konkrétní vybranou populaci.
Vysvětlení
- Mnoho výzkumníků, akademiků, tržních stratégů atd. Jde o distribuci vzorků namísto výběru celé populace. Díky tomu je sada dat snadná a také spravovatelná. Aby to bylo jednodušší, předpokládejme, že obchodník chce provést analýzu počtu mladých jezdících na kole mezi dvěma regiony ve věkové hranici 13-18 let.
- Za tímto účelem nebude brát v úvahu celou populaci přítomnou ve dvou regionech ve věku 13-18 let, což je prakticky nemožné, ai kdyby to bylo provedeno, je to příliš časově náročné a soubor dat není zvládnutelný . Místo toho si marketingový pracovník vezme vzorovou sadu po 200 kusech z každé oblasti a provede distribuci.
- Průměrný počet využití jízdního kola se zde označuje jako průměr vzorku. Každý vybraný vzorek má svůj vlastní generovaný průměr a rozdělení provedené pro získaný průměrný průměr je definováno jako rozdělení vzorku. Získaná odchylka se označuje jako standardní chyba.

Příklad distribuce vzorkování
- Za předpokladu, že výzkumník provádí studii o vahách obyvatel konkrétního města a má pět pozorování nebo vzorků, tj. 70 kg, 75 kg, 85 kg, 80 kg a 65 kg. Obecně se má za to, že město má normální rozložení a udržuje standardní odchylku 5 kg, pokud jde o hmotnostní míry. Průměr tedy lze vypočítat jako (70 + 75 + 85 + 80 + 65) / 5 = 75 kg.
- Předpokládáme také, že velikost populace je obrovská; tedy přejdeme ke druhému kroku, vydělíme počet pozorování nebo vzorků 1, tj. 1/5 = 0,20. Nyní musíme vzít druhou odmocninu 0,20, což je 0,45. Druhá odmocnina se poté vynásobí směrodatnou odchylkou, tj. 0,45 * 5 = 2,25 kg. Získaná standardní chyba je tedy 2,25 kg a průměrná hodnota byla 75 kg. Tyto dva faktory lze použít k popisu rozdělení.
Typy distribuce vzorkování
# 1 - Rozdělení vzorků střední hodnoty
- To lze definovat jako pravděpodobnostní rozpětí všech prostředků vzorků vybraných náhodně na základě pevné velikosti z konkrétní populace. Pokud se vzorky rozhodly pro normální populaci, šíření získaného průměru bude také normální vzhledem k průměru a standardní odchylce.
- Pokud populace není normální až klidná, rozdělení prostředků bude mít tendenci se blížit normálnímu rozdělení za předpokladu, že velikost vzorku je poměrně velká.
# 2 - Rozdělení vzorkování proporce
To je primárně spojeno se statistikami obsaženými v atributech. Zde vstupuje do hry role binomické distribuce. Obecně reaguje na zákony binomické distribuce, ale jak se zvětšuje velikost vzorku, obvykle se opět stává normální distribucí.
# 3 - Studentova T-distribuce
Tento typ distribuce se používá, když výzkumník nezná směrodatnou odchylku populace nebo pokud je velikost vzorku velmi malá. Tento typ distribuce je velmi symetrický a splňuje podmínku standardní normální variace. Jak se velikost vzorku zvětšuje, rovnoměrné rozdělení T má tendenci se velmi blížit normálnímu rozdělení.
# 4 - F Distribuce
- Když je v čitateli povinně přítomna větší rozptyl, najde distribuce F své využití, protože stupeň volnosti mění i kritické hodnoty změn F, což je použitelné pro velké i malé odchylky. To lze vypočítat z dostupných tabulek.
- Porovnání se provádí z naměřené hodnoty F patřící do sady vzorků a hodnoty, která se vypočítá z tabulky, pokud je dřívější hodnota stejná nebo větší než hodnota tabulky, bude nulová hypotéza studie odmítnuta.
# 5 - Distribuce vzorce Chi-Square
Tento typ distribuce se používá, když datová sada zahrnuje práci s hodnotami, které zahrnují přidání čtverců. Přidá se množina čtvercových množství náležejících k rozptylu vzorků, a tak se vytvoří distribuční rozpětí, které nazýváme distribucí chí-kvadrát.
Důležitost
- To je důležité, protože to zjednodušuje cestu ke statistickým závěrům. Kromě toho umožňuje, aby byly analytické úvahy zaměřeny spíše na statické rozdělení než na smíšené pravděpodobnostní rozpětí každé vybrané jednotky vzorku.
- Eliminace variability přítomné ve statistice se provádí pomocí tohoto rozdělení.
- Poskytuje nám odpověď na pravděpodobné výsledky, které se s největší pravděpodobností stanou.
- Hrají klíčovou roli v inferenčních statistických studiích, což znamená, že hrají hlavní roli při vytváření závěrů týkajících se celé populace.
Závěr
- To je ve statistice klíčové, protože funguje jako hlavní vodítko pro statistickou inferenci. V podstatě vedou výzkumníka, akademiky nebo statistiky o šíření frekvencí a signalizují řadu různých pravděpodobných výsledků, které lze dále označit celou populací.
- Prvotním faktorem, který je zde zahrnut, je průměr vzorku a standardní chyba, která nám při odhadech pomůže vypočítat také distribuci vzorkování. Existují různé typy distribučních technik a na základě scénáře a datové sady se každá z nich použije.