Normální rozdělení ve statistice - definice, příklad, interpretace

Co je normální rozdělení ve statistikách?

Normální distribuce je křivka distribuce kmitočtu ve tvaru zvonu, která pomáhá popsat všechny možné hodnoty, které může náhodná proměnná nabývat v daném rozsahu, přičemž většina distribuční oblasti je uprostřed a jen málo je v koncích, v extrémech. Toto rozdělení má dva klíčové parametry: průměr (µ) a směrodatnou odchylku (σ), které hrají klíčovou roli ve výpočtu návratnosti aktiv a ve strategii řízení rizik.

Jak interpretovat normální distribuci

Výše uvedený obrázek ukazuje, že statistické normální rozdělení je křivka ve tvaru zvonu. Rozsah možných výsledků tohoto rozdělení je celá reálná čísla ležící mezi -∞ až + ∞. Ocasy křivky zvonu se rozprostírají na obou stranách grafu (+/-) bez omezení.

  • Přibližně 68% všech pozorování spadá do +/- jedné standardní odchylky (σ)
  • Přibližně 95% všech pozorování spadá do +/- dvou standardních odchylek (σ)
  • Přibližně 99% všech pozorování spadá do +/- tří standardních odchylek (σ)

Má nulovou šikmost (symetrie distribuce). Pokud je distribuce dat asymetrická, pak je distribuce nerovnoměrná, pokud má datová sada zkosení větší než nula nebo kladnou zkosení. Pak je pravý ocas distribuce delší než levý a pro zápornou šikmost (méně než nula) bude levý ocas delší než pravý ocas.

Má špičatost 3 (měří špičku distribuce), což naznačuje, že distribuce není ani příliš špičková, ani příliš tenká. Pokud je špičatost větší než tři, je distribuce více vyvrcholena tučnějšími ocasy a pokud je špičatost menší než tři, pak má tenké ocasy a špičkový bod je nižší než normální rozdělení.

Vlastnosti

  • Představují rodinu distribuce, kde průměr a odchylka určují tvar distribuce.
  • Průměr, medián a způsob tohoto rozdělení jsou stejné.
  • Polovina hodnot je nalevo od středu a druhá polovina napravo.
  • Celková hodnota pod standardní křivkou bude vždy jedna.
  • S největší pravděpodobností je distribuce ve středu a méně hodnot leží na konci.

Transformace (Z)

Funkce hustoty pravděpodobnosti (PDF) náhodné proměnné (X) po rozdělení je dána vztahem:

kde -∞ <x <∞; -∞ <µ 0

Kde,

  • F (x) = funkce normální pravděpodobnosti
  • x = Náhodná proměnná
  • µ = střední hodnota distribuce
  • σ = směrodatná odchylka rozdělení
  • π = 3,14159
  • e = 2,71828

Transformační vzorec

Kde,

  • X = Náhodná proměnná

Příklady normálního rozdělení ve statistice

Pojďme diskutovat o následujících příkladech.

Příklad č. 1

Předpokládejme, že společnost má 10 000 zaměstnanců a strukturu několika platů podle pracovní role, ve které zaměstnanec pracuje. Platy jsou obecně rozděleny s průměrem populace µ = 60 000 $ a směrodatnou odchylkou populace σ = 15 000 $. Jaká bude pravděpodobnost, že náhodně vybraný zaměstnanec má plat nižší než 45 000 USD ročně.

Řešení

Jak je znázorněno na výše uvedeném obrázku, k zodpovězení této otázky musíme zjistit oblast pod normální křivkou od 45 po levý ocas. Abychom dostali správnou odpověď, musíme použít hodnotu Z-tabulky.

Nejprve musíme převést danou střední a směrodatnou odchylku na standardní normální rozdělení s průměrem (µ) = 0 a směrodatnou odchylkou (σ) = 1 pomocí transformačního vzorce.

Po převodu musíme vyhledat tabulku Z, abychom zjistili odpovídající hodnotu, která nám dá správnou odpověď.

Vzhledem k tomu,

  • Průměr (µ) = 60 000 $
  • Směrodatná odchylka (σ) = 15 000 $
  • Náhodná proměnná (x) = 45 000 $

Transformace (z) = (45000 - 60000/15000)

Transformace (z) = -1

Nyní je hodnota, která odpovídá -1 v Z-tabulce, 0,1587, což představuje plochu pod křivkou od 45 po cestu doleva. Naznačovalo to, že když náhodně vybereme zaměstnance, pravděpodobnost vydělávání méně než 45 000 $ ročně je 15,87%.

Příklad č. 2

Při zachování stejného scénáře jako výše zjistěte pravděpodobnost, že náhodně vybraný zaměstnanec vydělá při běžném rozdělení více než 80 000 $ ročně.

Řešení

Takže v této otázce musíme pomocí stejného vzorce zjistit stínovanou oblast od 80 do pravého ocasu.

Vzhledem k tomu,

  • Průměr (µ) = 60 000 $
  • Směrodatná odchylka (σ) = 15 000 $
  • Náhodná proměnná (X) = 80 000 $

Transformace (z) = (80000 - 60000/15000)

Transformace (z) = 1,33

Podle tabulky Z je ekvivalentní hodnota 1,33 0,9082 nebo 90,82%, což ukazuje, že pravděpodobnost náhodného výběru zaměstnanců vydělávajících méně než 80 000 $ ročně je 90,82%.

Ale pokud jde o otázku, musíme určit pravděpodobnost náhodných zaměstnanců, kteří vydělávají více než 80 000 $ ročně, takže musíme odečíst hodnotu od 100.

  • Náhodná proměnná (X) = 100% - 90,82%
  • Náhodná proměnná (X) = 9,18%

Takže pravděpodobnost, že zaměstnanci vydělají více než 80 000 $ ročně, je 9,18%.

Použití

  • Technický graf akciového trhu je často křivkou, která umožňuje analytikům a investorům provádět statistické závěry o očekávaném výnosu a riziku akcií.
  • Používá se v reálném světě, jako k určení nejpravděpodobnějšího nejlepšího času, který společnosti zabývající se pizzou potřebují k dodání pizzy a mnoha dalších reálných aplikací.
  • Používá se při porovnávání výšek dané populace, ve které bude mít většina lidí průměrnou velikost a jen velmi málo lidí bude mít nadprůměrnou nebo podprůměrnou výšku.
  • Používají se při určování průměrného akademického výkonu studentů, což pomáhá porovnávat pořadí studentů.

Závěr

Normální distribuce najde aplikace ve vědě o datech a analýze dat. Pokročilé technologie, jako je umělá inteligence a strojové učení použité společně s touto distribucí, mohou poskytnout lepší kvalitu dat, což pomůže jednotlivcům i společnostem v efektivním rozhodování.

Zajímavé články...