Multicollinearity (definice, typy) - Nejlepší 3 příklady s vysvětlením

Co je Multicollinearity?

Multicollinearity je statistický jev, ve kterém jsou dvě nebo více proměnných v regresním modelu závislé na ostatních proměnných takovým způsobem, že lze s vysokou mírou přesnosti lineárně předpovídat jednu od druhé. Obvykle se používá v observačních studiích a méně populární v experimentálních studiích.

Druhy multicollinearity

Existují čtyři typy multicollinearity

  • # 1 - Perfect Multicollinearity - Existuje, když nezávislé proměnné v rovnici předpovídají dokonalý lineární vztah.
  • # 2 - Vysoká multicollinearita - Vztahuje se k lineárnímu vztahu mezi dvěma nebo více nezávislými proměnnými, které spolu navzájem dokonale nekorelují.
  • # 3 - Strukturální multicollinearita - To je způsobeno samotným výzkumníkem vložením různých nezávislých proměnných do rovnice.
  • # 4 - Multicollineaarita založená na datech - je to způsobeno experimenty, které výzkumník špatně navrhuje.

Příčiny multicollinearity

Nezávislé proměnné, změna parametrů proměnných způsobí malou změnu proměnných. Na výsledek má významný dopad & Sběr dat se týká vzorku vybrané populace, která se odebírá.

Příklady multicollinearity

Příklad č. 1

Předpokládejme, že společnost ABC Ltd, KPO, byla najata farmaceutickou společností, aby poskytovala výzkumné služby a statistickou analýzu chorob v Indii. Za tímto účelem si společnost ABC ltd vybrala jako prima facie parametry věk, váhu, povolání, výšku a zdraví.

  • Ve výše uvedeném příkladu je situace multicollinearity, protože nezávislé proměnné vybrané pro studii přímo korelují s výsledky. Proto by bylo vhodné pro výzkumného pracovníka nejprve upravit proměnné před zahájením jakéhokoli projektu, protože výsledky budou přímo ovlivněny kvůli zde vybraným proměnným.

Příklad č. 2

Předpokládejme, že společnost ABC Ltd byla jmenována společností Tata Motors, aby pochopila, že objem prodeje motorů tata bude vysoký v které kategorii na trhu.

  • Ve výše uvedeném příkladu budou nejprve dokončeny nezávislé proměnné, na základě kterých je třeba výzkum dokončit. Může to být měsíční příjem, věk. Značka, nižší třída. Znamená to pouze to, že budou vybrána data, která se vejdou do všech těchto karet, aby bylo možné zjistit, kolik lidí si může koupit toto auto (tata nano), aniž by se vůbec dívalo na jiné auto.

Příklad č. 3

Předpokládejme, že společnost ABC Ltd byla najata, aby předložila zprávu, aby věděla, kolik lidí do 50 let je náchylných k infarktu. pro toto jsou parametry věk, pohlaví, anamnéza

  • Ve výše uvedeném příkladu existuje multicollinearita, která vznikla, protože nezávislou proměnnou „age“ je třeba vyladit na věk do 50 let pro pozvání od veřejnosti, aby se automaticky filtrovaly osoby starší 50 let.

Výhody

Níže jsou uvedeny některé výhody

  • Lineární vztah mezi nezávislými proměnnými v rovnici.
  • Velmi užitečné ve statistických modelech a zprávách z výzkumu připravených společnostmi založenými na výzkumu.
  • Přímý dopad na požadovaný výsledek.

Nevýhody

Níže jsou uvedeny některé z nevýhod

  • V některých situacích by tento problém byl vyřešen shromážděním více údajů o proměnných.
  • Nesprávné použití fiktivních proměnných, tj. Výzkumník může zapomenout používat fiktivní proměnné, kdykoli je to potřeba.
  • Vkládání 2 stejných nebo stejných proměnných do rovnice jako kg a lbs v hmotnosti.
  • Vložení proměnné do rovnice, což je kombinace 2.
  • Je složité provádět výpočty, protože se jedná o statistickou techniku ​​a k provedení je zapotřebí statistických kalkulaček.

Závěr

Multicollinearity je jedním z nejoblíbenějších statistických nástrojů často používaných v regresní analýze a statistické analýze pro velké databáze a požadovaný výstup. Všechny významné společnosti mají ve své společnosti samostatné statistické oddělení, které provádí statistickou regresní analýzu produktů nebo lidí, aby poskytlo vedení strategický pohled na trh a také jim pomohlo s vypracováním jejich dlouhodobých strategií při zachování této mysli. Grafické znázornění analýzy poskytuje čtenáři jasný obraz přímého vztahu, přesnosti a výkonu.

  • Pokud je cílem výzkumného pracovníka porozumět nezávislým proměnným v rovnici, pak pro něj bude multicollinearita velkým problémem.
  • Výzkumník musí provést požadované změny proměnných ve fázi 0 sám, jinak to může mít obrovský dopad na výsledky.
  • Multicollinearity lze provést zkoumáním korelační matice.
  • Při řešení problémů multicolinearity hrají významnou roli nápravná opatření.

Zajímavé články...