Empirické pravidlo - definice, vzorec, jak se používá ve statistice?

Co je empirické pravidlo ve statistice?

Empirické pravidlo ve statistice uvádí, že téměř všechna (95%) pozorování v normálním rozdělení leží v rozmezí 3 standardních odchylek od průměru. Toto je velmi důležité pravidlo a pomáhá při předpovídání.

Vzorec

Vzorec ukazuje předpokládané procento pozorování, která budou ležet v každé standardní odchylce od průměru.

Pravidlo říká, že:

  • 68% pozorování bude ležet v rozmezí +/- 1 standardní odchylky od průměru
  • 95% pozorování bude ležet v rozmezí +/- 2 standardní odchylky od průměru
  • 7% pozorování bude ležet v rozmezí +/- 3 standardní odchylky od průměru

Jak používat?

To se používá v trendu předpovídání souboru dat. Když je soubor dat rozsáhlý a bude náročné prozkoumat celou populaci, lze na vzorek použít empirické pravidlo, které vám poskytne odhad toho, jak budou údaje v populaci reagovat, pokud budete požádáni o nalezení průměrného platu všech účetní v USA. To je pak obtížný úkol, protože množina populace je obrovská. V takovém případě tedy můžete vybrat, řekněme, 90 pozorování náhodně z celé populace.

Takže teď budete mít 90 platů. Musíte najít střední a standardní odchylku pozorování. Pokud sledování sleduje normální rozdělení, lze jej použít a lze provést odhad platu všech účetních v USA.

Řekněme, že průměrný plat vzorku vyjde na 90 000 $. A standardní odchylka je 5 000 $. Takže z celé populace čerpá 68% účetních plat v rozmezí +/- 1 Standardní odchylky od průměru. Protože průměr je 90 000 $ a standardní odchylka je 5 000 $. Takže 68% všech účetních v USA je placeno v rozmezí 90 000 $ +/- (1 * 5 000 $). To je v rozmezí 85 000 až 95 000 $

Pokud se rozložíme o něco více, pak bude 95% všech účetních v USA vyplaceno v rozmezí Střední +/- 2 standardní odchylky. 90 000 $ +/- (2 * 5000). Rozsah je tedy 80 000 až 100 000 USD.

V širším rozsahu 99,7% všech účetních čerpá platy v rozmezí od +/- 3 standardní odchylky. To je 90 000 +/- (3 * 5000). Rozsah je 75 000 až 105 000 $

Můžete jasně vidět, že bez studia celé populace by bylo možné provést odhad týkající se populace. Pokud někdo plánuje pracovat jako účetní v USA, pak může snadno očekávat, že jeho plat se bude pohybovat od 75 000 do 105 000 USD

Tento druh odhadu pomáhá ulehčit práci a vytvářet předpovědi týkající se budoucnosti.

Empirické příklady pravidel

Pan X se pokouší najít průměrný počet let, které člověk přežije po odchodu do důchodu, přičemž věk odchodu do důchodu je 60 let. Pokud je průměrná doba přežití 50 náhodných pozorování 20 let a SD 3, pak zjistěte pravděpodobnost, že osoba bude čerpat důchod déle než 23 let

Řešení

Empirické pravidlo uvádí, že 68% pozorování bude ležet v rámci 1 standardní odchylky od průměru. Zde je průměr pozorování 20.

68% pozorování bude ležet v rozmezí 20 +/- 1 (standardní odchylka), což je 20 +/- 3. Rozsah je tedy 17 až 23.

Existuje 68% šance, že minimální roky, které člověk přežije po odchodu do důchodu, se pohybují mezi 17 až 23. Nyní procento, které leží mimo toto rozmezí, je (100 - 68) = 32%. 32 je rozděleno rovnoměrně na obě strany, což znamená 16% šanci, že minimální roky budou pod 17 a 16% šanci, že minimální roky budou větší než 23.

Takže pravděpodobnost, že osoba bude čerpat více než 23 let důchodu, je 16%.

Empirické pravidlo vs. Čebyševova věta

Empirické pravidlo se aplikuje na datové sady, které sledují normální rozdělení, což znamená zvonovitý tvar. V normálním rozdělení mají obě strany rozdělení 50% pravděpodobnost.

Pokud datová sada není normálně distribuována, pak existuje další aproximace nebo pravidlo, které platí pro všechny typy datových sad, což je Čebyševova věta. Říká tři věci:

  • Alespoň 3/4 th všech pozorování bude ležet uvnitř 2Standard odchylky od průměru. Je to silná aproximace. To znamená, že pokud existuje 100 pozorování, pak 3/4 th z pozorování, které jsou 75 pozorování bude ležet v rozmezí +/- 2 standardní odchylky od průměru.
  • Alespoň 8/9 th všech pozorování bude ležet uvnitř 3Standard odchylky od průměru.
  • Alespoň 1 - 1 / k 2 všech pozorování leží v K Standardní odchylky od střední hodnoty. Zde se K označuje jako jakékoli celé číslo.

Kdy použít?

Data jsou jako zlato v moderním světě. Z různých zdrojů proudí obrovská data a používají se pro různé aproximace nebo předpovědi. Pokud datová sada sleduje normální rozdělení, zobrazuje křivku ve tvaru zvonu; poté lze použít empirické pravidlo. Aplikuje se na pozorování za účelem vytvoření aproximace pro populaci.

Jakmile je vidět, že pozorování zobrazují strukturu normálního rozdělení, následuje empirické pravidlo, aby se zjistilo několik pravděpodobností pozorování. Pravidlo je velmi užitečné pro mnoho statistických předpovědí.

Závěr

Empirické pravidlo je statistický koncept, který pomáhá vykreslit pravděpodobnost pozorování a je velmi užitečný při hledání přiblížení obrovské populace. Vždy je třeba poznamenat, že se jedná o přibližné hodnoty. Vždy existují šance na odlehlé hodnoty, které nespadají do distribuce. Zjištění tedy nejsou přesná a měla by být přijata preventivní opatření, pokud bude postupováno podle předpovědi.

Zajímavé články...