T-test (definice, typy) - Krok za krokem příklady výpočtu

Co je T-test?

T-test je metoda používaná k odvození závěru ve statistice, jejímž cílem je zjistit, zda existuje nějaký zásadní rozdíl mezi dvěma prostředky, přičemž tyto dvě uvažované skupiny mohou být ve vzájemném vztahu.

Vysvětlení

  • Je zaměřen na testování hypotéz, které se v zásadě používá k testování hypotézy týkající se dané populace. T-test bere v úvahu statistiku T, hodnoty distribuce T a stupně volnosti, které se používají k určení pravděpodobnosti rozdílu mezi dvěma soubory dat.
  • Základní práce za T-Testem spočívá v tom, že bere v úvahu vzorek z každé ze dvou sad a vytváří prohlášení o problému zvážením nulové hypotézy, kde jsou oba prostředky uvedeny jako stejné.
  • Na základě srovnávacích vzorců jsou hodnoty nakresleny a porovnány se standardními hodnotami, což dále vede k přijetí nebo odmítnutí nulové hypotézy. Odmítnutí nulové hypotézy naznačuje, že soubor dat je docela přesný a není náhodný.

Druhy T-testu

Existují primárně čtyři typy t-testu, které jsou následující:

# 1 - 1-ukázkový T-test

Je zaměřen na testování, pokud se průměr hodnoty, na kterou se zaměřil, rovná průměru jedné populace, např. Testování, zda průměrná hmotnost studentů třídy 5 je vyšší než 45 kg

# 2 - 2-ukázkový T-test

Je zaměřen na testování, pokud se průměr hodnoty, na kterou se zaměřil, rovná průměru dvou nezávislých populací, např. Testování, zda se průměrná hmotnost studentů třídy 5 u chlapců liší od studentů třídy 5 u dívek.

# 3 - Spárovaný T-test

Je zaměřen na testování, zda se průměr hodnoty, na kterou se zaměřil, rovná průměru rozdílů mezi pozorováními, která jsou závislá. např. srovnání známek studentů před a po absolvování školného pro každý předmět nám pomáhá zjistit, zda je školné dostatečně významné pro zlepšení známek studentů.

# 4 - T-test v regresním výstupu

Zohledňuje koeficient v regresní rovnici a testuje, do jaké míry se liší od nulové hodnoty. např. je-li skóre přijímací zkoušky významným faktorem pro určení, zda student získá dobré konečné skóre.

Předpoklady T-testu

  • První předpoklad pro t-test souvisí s měřítkem měření. To souvisí s tím, zda stupnice sleduje spojitou nebo pořadovou stupnici
  • Druhým předpokladem může být náhodná povaha vzorku. To znamená, že shromážděná data by měla být čistě náhodná.
  • Třetím předpokladem může být to, že když vykreslíme data týkající se distribuce t-testu, měla by následovat normální distribuci a přinést zvlněný graf.
  • Čtvrtým předpokladem může být to, že pro t-distribuci a konkrétně pro získání tvaru zvonové křivky musíme mít větší velikost vzorku.
  • Konečným předpokladem může být t-test. Odchylka by měla mít homogenní povahu. E. standardní odchylky jsou téměř stejné.

Jak vypočítat?

Funguje ve dvou různých scénářích, tj. Jeden pro nezávislý vzorek a druhý pro závislý vzorek.

# 1 - Nezávislý ukázkový scénář

  • Musíme vypočítat součet, velikost vzorku, která je určena „N“, a hodnotu skóre pro průměr pro každý z nezávislých vzorků. Poté je třeba vypočítat stupeň volnosti pro každý nezávislý vzorek.
  • To je reprezentováno odečtením vzorku o jeden, který označujeme jako „n-1“. Poté je třeba vypočítat rozptyl a směrodatnou odchylku.
  • Přidají se stupně volnosti vzorků, což se označuje jako „df-total“. Dále musíme znásobit stupeň volnosti každého vzorku s rozptylem každého z nich. Musíme přidat výslednice a poté vydělit součet „df-total“. Získaný výsledek se nazývá sdružená varianta.
  • Sloučená varianta se pak vydělí n vzorků. Výsledek získaný pro všechny vzorky se poté sečte. Druhá odmocnina z toho je převzata a je označována jako standardní chyba rozdílu.
  • Nakonec musíme odečíst spodní průměr vzorku od většího průměru vzorku. Získaný rozdíl se pak vydělí standardní chybou rozdílu a získané výsledky se nazývají T-hodnota.

# 2 - Závislý ukázkový scénář

  • Skóre získaná z každé dvojice datových souborů jsou zaznamenána a musíme ji odečíst. Získané rozdíly se sčítají a označují jako „D.“ Rozdíly každého vzorku jsou na druhou a přidány k získání výslednice zvané „D-na druhou“. Poté musíme vynásobit „N“ nebo počet skóre spárovaných s „D-na druhou“.
  • Získaný výsledek se odečte od čtverce celkového „D.“ Tento výsledek je dále rozdělen na „N-1“. Je získána druhá odmocnina výslednice, která se nazývá dělitel. Nakonec musíme vydělit celkové „D“ dělitelem, což nám dá konečnou t-hodnotu.

Příklady T-testu

Vezměme v úvahu, že máme skóre pro každý předmět ve zkoušce konané po dobu dvou semestrů.

Krok 1: Odečtěte 1. fázi od 2. fáze

Krok 2: Sčítejte všechny rozdíly, tj. -55

Krok 3: Vyrovnejte rozdíly

Krok 4: Sečtěte všechny čtverce rozdílu, tj. 983

Krok 5: Použití vzorce pro výpočet hodnoty T.

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
  • = -9,16 / √ 15,96
  • = -9,16 / 3,99
  • Hodnota T = -2,29

Získaná hodnota T se poté porovná s hodnotou T získanou z tabulky pomocí p-hodnoty a stupně volnosti. Pokud je vypočtená hodnota t větší než hodnota tabulky na konkrétní předdefinované hladině alfa, můžeme nulovou hypotézu odmítnout a říkat, že existuje rozdíl mezi prostředky.

Když se používá?

Slouží k porovnání dvou prostředků nebo proporcí. Také používáme t-test, když jsou parametry populace neznámé uživateli. Existují zhruba tři případy použití scénáře t-testu, které jsou následující:

  • Nezávislý ukázkový t-test se používá, když chceme porovnat průměr dvou skupin.
  • Párový vzorek t-test se používá, když chceme porovnat průměr ze stejné skupiny, ale v různých časových bodech.
  • Jeden ukázkový t-test se používá, když potřebujeme zkontrolovat průměr individuální skupiny proti neznámému průměru.

Využití T-testu v aplikaci Excel

  • V aplikaci Excel je nejdůležitější a nejdůležitější věcí instalace doplňku s názvem Analýza dat. Poté musíme přejít na „Data“ na kartě nabídky a kliknout na ni. Zobrazí se zde možnost „Analýza dat“.
  • Abychom mohli provést T-test, musíme mít data ve sloupcovém formátu. Po kliknutí na „Analýza dat“ získáme řadu statistických testů, které můžeme provést, a ze seznamu musíme vybrat t-test a kliknout na „OK“.
  • Objeví se dialogové okno, kde musíme zadat data pro stopu 1 do pole variabilního rozsahu 1 a také data zkušební 2 do polí variabilního rozsahu 2. Ve výchozím nastavení zůstává hodnota alfa 0,05, ale lze ji změnit na základě našich preferencí. Pokud je vše v pořádku, klikněte na „OK“.
  • Nyní můžeme vidět výsledek našeho T-testu na listu aplikace Excel. Nejdůležitější hodnotou, kterou je zde třeba poznamenat, je hodnota P. Na základě toho, co jsme vybrali naši hodnotu alfa, je-li naše hodnota P v aplikaci Excel menší než hodnota alfa, můžeme dojít k závěru, že mezi prostředky našich dvou sad hodnot je statisticky významný rozdíl.

Závěr

T-test je zaměřen na testování hypotéz, které se v zásadě používá k testování hypotéz vztahujících se k dané populaci. Říká nám úroveň významnosti rozdílu mezi skupinami, které se obecně měří na základě průměru. Zde v podstatě zjišťujeme rozdíl mezi populačními prostředky a předpokládanou hodnotou.

Zajímavé články...