Co je T-test?
T-test je metoda používaná k odvození závěru ve statistice, jejímž cílem je zjistit, zda existuje nějaký zásadní rozdíl mezi dvěma prostředky, přičemž tyto dvě uvažované skupiny mohou být ve vzájemném vztahu.
Vysvětlení
- Je zaměřen na testování hypotéz, které se v zásadě používá k testování hypotézy týkající se dané populace. T-test bere v úvahu statistiku T, hodnoty distribuce T a stupně volnosti, které se používají k určení pravděpodobnosti rozdílu mezi dvěma soubory dat.
- Základní práce za T-Testem spočívá v tom, že bere v úvahu vzorek z každé ze dvou sad a vytváří prohlášení o problému zvážením nulové hypotézy, kde jsou oba prostředky uvedeny jako stejné.
- Na základě srovnávacích vzorců jsou hodnoty nakresleny a porovnány se standardními hodnotami, což dále vede k přijetí nebo odmítnutí nulové hypotézy. Odmítnutí nulové hypotézy naznačuje, že soubor dat je docela přesný a není náhodný.

Druhy T-testu
Existují primárně čtyři typy t-testu, které jsou následující:
# 1 - 1-ukázkový T-test
Je zaměřen na testování, pokud se průměr hodnoty, na kterou se zaměřil, rovná průměru jedné populace, např. Testování, zda průměrná hmotnost studentů třídy 5 je vyšší než 45 kg
# 2 - 2-ukázkový T-test
Je zaměřen na testování, pokud se průměr hodnoty, na kterou se zaměřil, rovná průměru dvou nezávislých populací, např. Testování, zda se průměrná hmotnost studentů třídy 5 u chlapců liší od studentů třídy 5 u dívek.
# 3 - Spárovaný T-test
Je zaměřen na testování, zda se průměr hodnoty, na kterou se zaměřil, rovná průměru rozdílů mezi pozorováními, která jsou závislá. např. srovnání známek studentů před a po absolvování školného pro každý předmět nám pomáhá zjistit, zda je školné dostatečně významné pro zlepšení známek studentů.
# 4 - T-test v regresním výstupu
Zohledňuje koeficient v regresní rovnici a testuje, do jaké míry se liší od nulové hodnoty. např. je-li skóre přijímací zkoušky významným faktorem pro určení, zda student získá dobré konečné skóre.
Předpoklady T-testu
- První předpoklad pro t-test souvisí s měřítkem měření. To souvisí s tím, zda stupnice sleduje spojitou nebo pořadovou stupnici
- Druhým předpokladem může být náhodná povaha vzorku. To znamená, že shromážděná data by měla být čistě náhodná.
- Třetím předpokladem může být to, že když vykreslíme data týkající se distribuce t-testu, měla by následovat normální distribuci a přinést zvlněný graf.
- Čtvrtým předpokladem může být to, že pro t-distribuci a konkrétně pro získání tvaru zvonové křivky musíme mít větší velikost vzorku.
- Konečným předpokladem může být t-test. Odchylka by měla mít homogenní povahu. E. standardní odchylky jsou téměř stejné.
Jak vypočítat?
Funguje ve dvou různých scénářích, tj. Jeden pro nezávislý vzorek a druhý pro závislý vzorek.
# 1 - Nezávislý ukázkový scénář
- Musíme vypočítat součet, velikost vzorku, která je určena „N“, a hodnotu skóre pro průměr pro každý z nezávislých vzorků. Poté je třeba vypočítat stupeň volnosti pro každý nezávislý vzorek.
- To je reprezentováno odečtením vzorku o jeden, který označujeme jako „n-1“. Poté je třeba vypočítat rozptyl a směrodatnou odchylku.
- Přidají se stupně volnosti vzorků, což se označuje jako „df-total“. Dále musíme znásobit stupeň volnosti každého vzorku s rozptylem každého z nich. Musíme přidat výslednice a poté vydělit součet „df-total“. Získaný výsledek se nazývá sdružená varianta.
- Sloučená varianta se pak vydělí n vzorků. Výsledek získaný pro všechny vzorky se poté sečte. Druhá odmocnina z toho je převzata a je označována jako standardní chyba rozdílu.
- Nakonec musíme odečíst spodní průměr vzorku od většího průměru vzorku. Získaný rozdíl se pak vydělí standardní chybou rozdílu a získané výsledky se nazývají T-hodnota.
# 2 - Závislý ukázkový scénář
- Skóre získaná z každé dvojice datových souborů jsou zaznamenána a musíme ji odečíst. Získané rozdíly se sčítají a označují jako „D.“ Rozdíly každého vzorku jsou na druhou a přidány k získání výslednice zvané „D-na druhou“. Poté musíme vynásobit „N“ nebo počet skóre spárovaných s „D-na druhou“.
- Získaný výsledek se odečte od čtverce celkového „D.“ Tento výsledek je dále rozdělen na „N-1“. Je získána druhá odmocnina výslednice, která se nazývá dělitel. Nakonec musíme vydělit celkové „D“ dělitelem, což nám dá konečnou t-hodnotu.
Příklady T-testu
Vezměme v úvahu, že máme skóre pro každý předmět ve zkoušce konané po dobu dvou semestrů.

Krok 1: Odečtěte 1. fázi od 2. fáze

Krok 2: Sčítejte všechny rozdíly, tj. -55
Krok 3: Vyrovnejte rozdíly

Krok 4: Sečtěte všechny čtverce rozdílu, tj. 983
Krok 5: Použití vzorce pro výpočet hodnoty T.
T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N- = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
- = -9,16 / √ 15,96
- = -9,16 / 3,99
- Hodnota T = -2,29
Získaná hodnota T se poté porovná s hodnotou T získanou z tabulky pomocí p-hodnoty a stupně volnosti. Pokud je vypočtená hodnota t větší než hodnota tabulky na konkrétní předdefinované hladině alfa, můžeme nulovou hypotézu odmítnout a říkat, že existuje rozdíl mezi prostředky.
Když se používá?
Slouží k porovnání dvou prostředků nebo proporcí. Také používáme t-test, když jsou parametry populace neznámé uživateli. Existují zhruba tři případy použití scénáře t-testu, které jsou následující:
- Nezávislý ukázkový t-test se používá, když chceme porovnat průměr dvou skupin.
- Párový vzorek t-test se používá, když chceme porovnat průměr ze stejné skupiny, ale v různých časových bodech.
- Jeden ukázkový t-test se používá, když potřebujeme zkontrolovat průměr individuální skupiny proti neznámému průměru.
Využití T-testu v aplikaci Excel
- V aplikaci Excel je nejdůležitější a nejdůležitější věcí instalace doplňku s názvem Analýza dat. Poté musíme přejít na „Data“ na kartě nabídky a kliknout na ni. Zobrazí se zde možnost „Analýza dat“.
- Abychom mohli provést T-test, musíme mít data ve sloupcovém formátu. Po kliknutí na „Analýza dat“ získáme řadu statistických testů, které můžeme provést, a ze seznamu musíme vybrat t-test a kliknout na „OK“.
- Objeví se dialogové okno, kde musíme zadat data pro stopu 1 do pole variabilního rozsahu 1 a také data zkušební 2 do polí variabilního rozsahu 2. Ve výchozím nastavení zůstává hodnota alfa 0,05, ale lze ji změnit na základě našich preferencí. Pokud je vše v pořádku, klikněte na „OK“.
- Nyní můžeme vidět výsledek našeho T-testu na listu aplikace Excel. Nejdůležitější hodnotou, kterou je zde třeba poznamenat, je hodnota P. Na základě toho, co jsme vybrali naši hodnotu alfa, je-li naše hodnota P v aplikaci Excel menší než hodnota alfa, můžeme dojít k závěru, že mezi prostředky našich dvou sad hodnot je statisticky významný rozdíl.
Závěr
T-test je zaměřen na testování hypotéz, které se v zásadě používá k testování hypotéz vztahujících se k dané populaci. Říká nám úroveň významnosti rozdílu mezi skupinami, které se obecně měří na základě průměru. Zde v podstatě zjišťujeme rozdíl mezi populačními prostředky a předpokládanou hodnotou.