Regrese (význam, typy) - Co je regresní analýza?

Co je to regrese?

Regresní analýza je měření založené na statistice používané v oblasti financí, investování atd., Jehož cílem je vytvořit vztah mezi závislou proměnnou a dalšími řadami nezávislých proměnných a hlavním zaměřením je určení síly výše uvedeného vztahu.

Vysvětlení

  • Abychom laicky vysvětlili regresní analýzu, předpokládejme, že vedoucí prodeje společnosti se velmi snaží předpovídat tržby následujícího měsíce. Zahrnuje mnoho faktorů, které řídí prodej produktu, od počasí až po novou strategii konkurenta, festival a změnu životního stylu spotřebitelů.
  • Jedná se o způsob vyrovnání z několika faktorů, které ovlivňují prodej, a které mají největší dopad. Může pomoci při zodpovězení mnoha otázek, například toho, co jsou nejdůležitější faktory, jaké faktory jsou méně důležité, jaký je vztah mezi těmito faktory a co je nejdůležitější, jaká je záruka těchto faktorů.
  • Tyto faktory se nazývají proměnné. Hlavní faktor, který se snažíme předpovědět, se nazývá závislá proměnná a další faktory, které mají vliv na závislou proměnnou, se nazývají nezávislé proměnné.

Vzorec

Jednoduchou lineární regresní analýzu v aplikaci Excel lze vyjádřit jako vzorec níže a měří vztah mezi závislou proměnnou a jednou nezávislou proměnnou.

Y = a + bX + ϵ

Tady:

  • Y - závislá proměnná
  • X - Nezávislá (vysvětlující) proměnná
  • a - Zachytit
  • b - sklon
  • ϵ - Zbytkové (chyba)

Jak interpretovat regresní analýzu?

To lze interpretovat za předpokladu jednoduchého scénáře. Zde bereme vztah mezi cenami sbírky starožitností pro aukci a dobou jejího stáří. Čím více starožitnost stárne, tím vyšší je její cena. Za předpokladu, že jsme nastavili data pro posledních 50 položek, které byly vydraženy, můžeme předpovědět, jaké budou budoucí aukční ceny na základě stáří položky. Pomocí těchto dat můžeme vytvořit regresní rovnici.

Regresní vzorec, který může nastavit vztah mezi věkem a cenou, je následující:

y = chyba β0 + β1 x +
  • Zde je závislým faktorem Y. Y představuje cenu každé položky, která má být dražena, zatímco nezávislý faktor je X, který určuje věk.
  • Parametry β0 a β1 jsou parametry, které nejsou známy a budou odhadnuty rovnicí.
  • β0 je konstanta, která se používá k definování lineární trendové čáry protínající osu Y.
  • β1 je konstanta, která ukazuje velikost změny hodnoty závislé proměnné jako související funkci změny implikované pro nezávislé proměnné.
  • Tomu se v zásadě říká sklon rovnice. Pokud je sklon liniovou linií, znamená to, že existuje poměrný vztah mezi věkem a cenou, a pokud je sklon inverzní, znamená to, že vztah je nepřímo úměrný.
  • Chyba může být definována jako hluk nebo změnu v cílové proměnné a je náhodné.

Reálné příklady regresní analýzy

Předpokládejme, že musíme navázat vztah mezi prodejem, ke kterému došlo, a částkou utracenou za reklamu související s produktem.

Obecně můžeme pozorovat pozitivní vztah mezi množstvím prodeje a částkou utracenou za reklamu. Spojením jednoduché lineární regresní rovnice jsme dostali:

Y = a + bX

Předpokládejme, že dostaneme hodnotu jako

Y = 500 + 30X

Interpretace výsledku:

Předpokládaný sklon 30 nám pomáhá vyvodit závěr, že průměrný prodej se zvyšuje o 30 $ ročně, jak rostou výdaje na reklamu.

Druhy regresní analýzy

# 1 - Lineární

To lze vyjádřit jako vzorec níže a měří vztah mezi závislou proměnnou a jednou nezávislou proměnnou.

# 2 - Polynomial

V této metodě se analýza používá k měření vztahu mezi jednotlivými závislými faktory a více nezávislými proměnnými.

# 3 - Logistické

Zde má závislý faktor nebo proměnná binární povahu. Nezávislé proměnné mohou být spojité nebo binární. V multinomiální logistické regrese si můžeme dovolit mít více než dvě kategorie při výběru naší nezávislé proměnné.

# 4 - Kvantilní

Toto je aditivní koncept lineární regrese a primárně se používá, když jsou v datech odlehlé hodnoty a šikmost.

# 5 - Elastická síť

To je užitečné, když člověk zpracovává velmi vysoké korelované nezávislé proměnné.

# 6 - Principal Components Regression (PCR)

Jedná se o techniku, která je použitelná, pokud je v datech příliš mnoho nezávislých proměnných nebo multicollinearity

# 7 - Částečné nejmenší čtverce (PLS)

Jedná se o opačnou metodu hlavní složky, kde máme nezávislé korelace vysoce korelované. Je také použitelné, když existuje mnoho nezávislých proměnných.

# 8 - Podpora vektoru

To může poskytnout řešení pro lineární a nelineární modely. Využívá nelineárních funkcí jádra k nalezení optimálního řešení pro nelineární modely.

# 9 - Pořadové

Je použitelný pro predikci hodnotených hodnot. V zásadě je vhodné, když je závislá proměnná ordinální povahy

# 10 - Poisson

To platí, pokud má závislá proměnná údaje o počtu.

# 11 - Negativní binomický

Je také použitelné spravovat pouze údaje o počtu, že záporná binomická regrese nepředpokládá rozdělení počtu majícího rozptyl rovný jeho průměru, zatímco Poissonova regrese předpokládá rozptyl rovný jeho průměru.

# 12 - Quasi Poisson

Je to náhrada za negativní binomickou regresi. Platí také pro údaje o rozptýleném počtu. Rozptyl kvazi-Poissonova modelu je lineární funkcí průměru, zatímco rozptyl záporného binomického modelu je kvadratickou funkcí průměru.

# 13 - Cox

Spíše se používá pro analýzu časových údajů.

Rozdíl mezi regresí a korelací

  • Regrese stanoví vztah mezi nezávislou odchylkou a závislou proměnnou, kde jsou obě proměnné odlišné, zatímco korelace určuje asociaci nebo závislost dvou proměnných, kde není rozdíl mezi oběma proměnnými.
  • Hlavním cílem regrese je vytvořit linii nejlepší shody a odhad jedné proměnné se provádí na základě ostatních, zatímco v korelaci se ukazuje lineární vztah mezi dvěma proměnnými.
  • V tomto případě odhadujeme velikost určité změny v rozpoznané proměnné (X) na odhadované proměnné (Y), zatímco v korelaci se koeficient používá k měření, do jaké míry se obě proměnné pohybují společně.
  • Jedná se o proces odhadu velikosti náhodných nezávislých proměnných na základě velikosti staticky závislé proměnné, zatímco korelace nám pomáhá rozhodnout o konkrétní hodnotě k vyjádření vzájemné závislosti mezi oběma proměnnými.

Závěr

  • Regresní analýza primárně využívá data k navázání vztahu mezi dvěma nebo více proměnnými. Zde se předpokládá, že vztahy existující v minulosti se budou odrážet i v současnosti nebo budoucnosti. Málokdo to považuje za časové zpoždění mezi minulostí a současností / budoucností.
  • Jedná se však o široce používanou techniku ​​předpovídání a odhadování. I když jde o matematiku, kterou může mnoho uživatelů považovat za obtížnou, lze tuto techniku ​​poměrně snadno použít, zejména je-li k dispozici model.

Zajímavé články...