Vzorec pro určení velikosti vzorku populace
Vzorec velikosti vzorku pomáhá při výpočtu nebo stanovení minimální velikosti vzorku, která je požadována, aby bylo možné znát adekvátní nebo správný podíl populace spolu s úrovní spolehlivosti a mírou chyby.
Pojem „vzorek“ označuje část populace, která nám umožňuje vyvodit závěry o populaci, a proto je důležité, aby velikost vzorku byla dostatečně adekvátní, aby bylo možné učinit smysluplné závěry. Jinými slovy, je to minimální velikost, která je potřebná k odhadu skutečného podílu populace s požadovanou mírou chyb a úrovně spolehlivosti. Stanovení vhodné velikosti vzorku je tedy jedním z opakujících se problémů statistické analýzy. Jeho rovnici lze odvodit pomocí velikosti populace, kritické hodnoty normálního rozdělení, podílu vzorku a míry chyby.
Velikost vzorku n = N * (Z 2 * p * (1-p) / e 2 ) / (N - 1 + (Z 2 * p * (1-p) / e 2 ))
kde,
- N = velikost populace,
- Z = kritická hodnota normálního rozdělení na požadované úrovni spolehlivosti,
- p = podíl vzorku,
- e = mez chyby
Jak vypočítat velikost vzorku? (Krok za krokem)
- Krok 1: Nejprve určete velikost populace, což je celkový počet odlišných entit ve vaší populaci, a je označena N. (Poznámka: V případě, že velikost populace je velmi velká, ale přesný počet není znám, použijte 100 000, protože velikost vzorku se u populací větších než to příliš nemění.)
- Krok 2: Dále určete kritickou hodnotu normálního rozdělení na požadované úrovni spolehlivosti. Například kritická hodnota na 95% úrovni spolehlivosti je 1,96.
- Krok 3: Dále určete podíl vzorku, který lze použít z výsledků předchozího průzkumu nebo který lze shromáždit spuštěním malého pilotního průzkumu. (Poznámka: pokud si nejste jisti, můžete vždy použít 0,5 jako konzervativní přístup a dá to největší možnou velikost vzorku.)
- Krok 4: Dále určete hranici chyby, což je rozsah, ve kterém se očekává, že skutečná populace bude ležet. (Poznámka: Čím menší je hranice chyby, tím větší je přesnost, a tedy přesná odpověď.)
- Krok 5: Nakonec lze rovnici velikosti vzorku odvodit pomocí velikosti populace (krok 1), kritické hodnoty normálního rozdělení na požadované úrovni spolehlivosti (krok 2), podílu vzorku (krok 3) a míry chyby ( krok 4), jak je znázorněno níže.

Příklady
Příklad č. 1
Vezměme si příklad maloobchodníka, který má zájem vědět, kolik zákazníků si od něho koupilo položku poté, co si v určitý den prohlédlo jejich web. Vzhledem k tomu, že jejich web má v průměru 10 000 zhlédnutí za den, určuje velikost vzorku zákazníků, které musí sledovat na 95% úrovni spolehlivosti s 5% mírou chyb, pokud:
- Nejsou si jisti aktuálním konverzním poměrem.
- Z předchozích průzkumů vědí, že míra konverze je 5%.
Vzhledem k tomu,
- Velikost populace, N = 10 000
- Kritická hodnota na 95% úrovni spolehlivosti, Z = 1,96
- Mez chyby, e = 5% nebo 0,05
1 - Protože současný přepočítací koeficient není znám, předpokládejme p = 0,5

Proto lze velikost vzorku vypočítat pomocí vzorce jako,

= (10 000 * (1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ) / (10 000 - 1 + ((1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ))))

Pro odvození smysluplného závěru tedy bude stačit 370 zákazníků.
2 - Aktuální přepočítací koeficient je p = 5% nebo 0,05
Proto lze velikost vzorku vypočítat pomocí výše uvedeného vzorce jako,

= (10 000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (10 000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Proto bude v tomto případě pro odvození smysluplného závěru dostatečná velikost 72 zákazníků.
Příklad č. 2
Vezměme si výše uvedený příklad a v tomto případě předpokládejme, že velikost populace, tj. Denní zobrazení webu, je mezi 100 000 a 120 000, ale přesná hodnota pak není známa. Zbytek hodnot je stejný, spolu s konverzním poměrem 5%. Vypočítejte velikost vzorku pro 100 000 i 120 000.
Vzhledem k tomu,
- Podíl vzorku, p = 0,05
- Kritická hodnota na 95% úrovni spolehlivosti, Z = 1,96
- Mez chyby, e = 0,05

Proto lze velikost vzorku pro N = 100 000 vypočítat jako,

= (100000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (100000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Proto lze velikost vzorku pro N = 120 000 vypočítat jako,

= (120000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (120000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Proto je dokázáno, že jak se velikost populace zvětšuje na velmi velkou, stává se při výpočtu velikosti vzorku irelevantní.
Relevance a použití
Výpočet velikosti vzorku je důležitý pro pochopení konceptu vhodné velikosti vzorku, protože se používá pro validitu výsledků výzkumu. V případě, že je příliš malý, nepřinese platné výsledky, zatímco příliš velký vzorek může být ztrátou peněz i času. Statisticky se významná velikost vzorku používá převážně pro průzkumy trhu, zdravotnictví a vzdělávání.