Jednovýběrový t-test

Testy hypotézy o průměru (t-testy)

Jedním z nejdůležitějších přínosů do počtu pravděpodobnosti je práce Henry Gosseta, kterou publikoval pod jménem Student. Jestliže náhodné veličiny x1, x2, …, xn, mají Gaussovo rozdělení s parametry µ a σ a jsou nezávislé, pak z nich utvořená náhodná veličina t má Studentovo rozdělení o n−1 stupních volnosti.

Tato věta je velmi důležitá, protože umožňuje testování hypotéz o µ bez ohledu na to, jaký je parametr σ. Obvykle se spíš ptáme, jakou má rozdělení střední hodnotu a nezajímá nás tolik, jaká je jeho směrodatná odchylka. Právě tento parametr ve vzorci, kterým definujeme T (testové kritérium), není obsažen. Jedna realizace takové náhodné veličiny se uskuteční tak, že provedeme n nezávislých experimentů s Gaussovým rozdělením o stejných parametrech a vypočteme konkrétní hodnotu t podle uvedeného vzorce. Víme, že náhodná veličina T má Studentovo rozdělení o n1 stupních volnosti.

t = \frac{\overline x - \mu _0 }{S/\sqrt n }

Představme si, že známe µ0, σ znát nemusíme. Znalost Studentova rozdělení nám umožní testování nulové hypotézy H0: µ = µ0, kterou slovně vyjádříme tak, že rozdělení má střední hodnotu rovnu µ0. Jestliže chceme testovat, musíme stanovit obor přijetí a obor zamítnutí. Obor přijetí je doplňkem oboru zamítnutí. Do oboru přijetí zahrneme ty hodnoty t, které se vyskytnou s větší pravděpodobností. Je vhodné si uvědomit několik věcí. Jednou z nich je to, že Studentovo rozdělení má zvonovitý tvar a že je jasné, kdy je hustota pravděpodobnosti v nějakém bodě větší než v jiném bodě. Pro libovolné stejně velké intervaly platí, že je-li hustota v prvním z intervalů vždy větší než v druhém intervalu, je pravděpodobnost padnutí náhodné veličiny do prvního intervalu větší než pravděpodobnost padnutí do druhého intervalu. Abychom to ještě lépe viděli, můžeme si číselnou osu rozdělit na libovolně malé ale stejně široké disjunktní intervaly a jim přiřadit pravděpodobnosti jako plochy pod křivkou hustoty.

Testujeme-li na hladině významnosti 5 %, musíme nalézt interval, do kterého padne náhodná veličina s pravděpodobností 0,95. Takový interval má zároveň obsahovat právě ty body, které mají větší hustotu než body mimo tento interval. Ze zvonovitosti a symetrie kolem nuly plyne, že to bude interval se středem v bodě nula. Plocha pod křivkou od nuly do pravého koncového bodu musí být rovna 0,95/2 = 0,475.

Totéž by platilo pro plochu pod křivkou od levého koncového bodu intervalu do nuly.

Ze symetrie víme (pomůže obrázek), že plocha pod křivkou od minus nekonečna do nuly je rovna 1/2. Rovněž plocha pod křivkou od nuly do nekonečna je 1/2. Hledáme-li pravý koncový bod intervalu, je to totéž jako hledat takový bod, pro který platí, že plocha pod křivkou od minus nekonečna do tohoto bodu je rovna 0,975=0,5+0,475. To je právě 97,5% kvantil Studentova rozdělení o n-1 stupních volnosti a značí se tn-1, 0,975.



Díky symetrii hustoty je celý obor přijetí dán intervalem (-tn-1, 0,975 ; tn, 0,975) při 5% hladině významnosti, obor zamítnutí je dán sjednocením intervalů (-∞ ; -tn-1, 0,975\cup ( tn-1, 0,975 ; ∞). Při 1% hladině významnosti je oborem přijetí interval (-tn-1, 0,995 ; tn-1, 0,995) a oborem zamítnutí je interval (- ∞; -tn-1, 0,995 )  \cup ( tn-1, 0,995 ; ∞).

Kvantil Studentova rozdělení, který odděluje obor přijetí a zamítnutí se nazývá kritická hodnota. Kvantily Studentova rozdělení jsou tabelovány.

Některé tabulky uvádějí přímo hladinu významnosti v hlavičce, jiné uvádějí číslo 1-\alpha/2, což je příslušný kvantil. Bývá v tom trochu nepořádek, proto je nutné si vždy zkontrolovat, o jakou tabulku se jedná. Pro n > 30 Studentovo rozdělení již téměř splývá s rozdělením Gaussovým.

Jednovýběrový t-test

Chceme zjistit, zda střední hodnota zkoumané náhodné veličiny je rovna nám známé střední hodnotě µ0 a víme, že rozdělení zkoumané náhodné veličiny je normální. Statistický zápis je H0: µ = µ0 . Zvolíme hladinu významnosti (obvykle 5%). Provedeme n nezávislých experimentů, jejichž výsledkem je n číselných hodnot. Vypočteme z nich výběrový aritmetický průměr a výběrovou směrodatnou odchylku a dosadíme je do vzorce

t = \frac{\overline x - \mu _0 }{S/\sqrt n }

Tím získáme hodnotu testového kritéria. Pomocí kvantilů Studentova rozdělení stanovíme obor přijetí a zjistíme, zda je testové kritérium v oboru přijetí či v oboru zamítnutí. Je-li testové kriterium v oboru přijetí, H0 nezamítneme, je-li v oboru zamítnutí, tak H0 zamítneme a přimeme alternativní hypotézu Ha (Ha: µ≠ µ0).

Postup je obdobný u všech testů: Stanovíme H0 (srovnávané charakteristiky jsou stejné, tj. jejich rozdíl se rovná nule), Ha a hladinu významnosti. Zvolíme testové kritérium, což je náhodná veličina. (Testové kriterium můžeme volit jen takové, u kterého je známo rozdělení. To je základní podmínkou pro to, abychom mohli určit obor přijetí.) Určíme obor přijetí a obor zamítnutí. Porovnáme testové kritérium s oborem přijetí a učiníme rozhodnutí o H0.

Příklad 1:

Ze vzorku krve jednoho pacienta byla změřena velikost 50 červených krvinek. Průměrná velikost u těchto 50 krvinek byla 7,13 mm a směrodatná odchylka 0,35 mm. Máme zjistit (na hladině významnosti 5 %), zda průměrná velikost červených krvinek tohoto pacienta odpovídá normě, tj. 7,2 mm.

Řešení příkladu 1:

Nejprve formulujeme H0: µ = 7,2 [µm], Ha: µ ≠ 7,2 [µm]. Hladina významnosti je 5 %. Nyní vypočteme testové kritérium: t = |7,13 – 7,2|/(0,35/√50) = 1,41.

Obor přijetí nulové hypotézy stanovíme buď pomocí tabulky kritických hodnot Studentova rozdělení nebo v Excelu tak, že funkcí TINV vypočítáme 97,5% kvantil Studentova rozdělení (zadáme pravděpodobnost = 0,05), pro počet stupňů volnosti 49. Hledaný kvantil je t49; 0,975 = 2,01. To znamená, že při platnosti nulové hypotézy je pravděpodobnost, že testové kriterium překročí číslo 2,01 rovna 0,025. Protože se jedná o rozdělení symetrické, víme že pravděpodobnost, že testové kriterium bude menší než –2,01 je také rovna 0,025. Jako obor přijetí vezmeme interval <–2,01; 2,01>. Víme, že plocha pod křivkou je v oboru přijetí nulové hypotézy rovna 0,95. Obor zamítnutí je sjednocením dvou částí (–; 2,01)  \cup (2,01; ). Známe též plochu pod křivkou vlevo od –2,01 a vpravo od 2,01. Dohromady je tato plocha 0,025 + 0,025 = 0,05, což je hladina významnosti.

Pro naše data je testové kriterium t rovno 1,41. Protože je v oboru přijetí, H0 na 5% hladině významnosti nezamítneme.


Můžeme na věc jít také jinak: Jaká je plocha pod křivkou od čísla 1,41 do nekonečna? Už víme, že je větší než 0,025, protože 1,41 je vlevo od 97,5-ti procentního kvantilu, ale představme si, že to nevíme a kvantil Studentova rozdělení neznáme. Označíme tuto plochu písmenem A. Vzhledem k tomu, že provádíme oboustranný test, musíme zahrnout také plochu od minus nekonečna do čísla -1,41. Ta bude stejná a jejich součtem dostaneme celkovou plochu 2A. Velikosti této plochy říkáme p-hodnota. Ručně je obtížné tuto plochu přesně vypočítat, ale na počítači (např. V Excelu pomocí funkce TDIST) to jde snadno. V našem případě je p-hodnota 0,16. Porovnáme ji s hladinou významnosti. Je-li p-hodnota menší než hladina významnosti, H0 zamítneme. Pokud tato podmínka není splněna, nemůžeme H0 na dané hladině významnosti zamítnout. V našem případě je 0,16 > 0,05, proto H0 na 5% hladině významnosti nezamítneme.

Pochopení souvislosti mezi p-hodnotou, testovým kritériem, hladinou významnosti a kritickou hodnotou usnadní následující obrázek.


Statistické programy často uvádějí jako výsledek statistického testu p-hodnotu. Ta je definována jako nejmenší hladina významnosti, na které by se H0 dala zamítnout. Je tudíž jasné, že stačí jen znalost p-hodnoty a hladiny významnosti a můžeme provést rozhodnutí, aniž bychom znali testové kritérium a stanovovali obor přijetí a zamítnutí.

Připomeňme si znovu, že hladinu významnosti stanovujeme před testováním, neboť pravidla rozhodování mají být určena předem.

Příklad 2:

Průměrná hladina prothrombinu v normální populaci je 20,0 mg/100 mL plasmy. V souboru 30 pacientů, u nichž byl zjištěn nedostatek vitamínu K, byla průměrná hladina prothrombinu 18,3 mg/100 mL a směrodatná odchylka 3,8 mg/100 mL plasmy. Můžeme na základě těchto výsledků tvrdit, že průměrná hladina prothrombinu je u lidí s nedostatkem vitamínu K nižší než u normální populace? Rozhodnutí provedeme na 5% hladině významnosti.

Řešení příkladu 2:

Nejprve formulujeme H0 a Ha. Vzhledem k zadání problému bude alternativní hypotéza jednostranná. H0: µ = 20,0 [mg/100 mL], Ha: µ < 20,0 [mg/100 mL]. Hladina významnosti je 5 %. Nyní vypočteme testové kritérium: t = |18,3 – 20,0|/(3,8/√30) = 2,45.

Obor přijetí nulové hypotézy stanovíme buď pomocí tabulky kritických hodnot Studentova rozdělení nebo v Excelu tak, že funkcí TINV vypočítáme 95% kvantil Studentova rozdělení (zadáme pravděpodobnost = 0,1), pro počet stupňů volnosti 29. Hledáme kvantil 95%, protože tentokrát bude celý obor zamítnutí na jedné straně rozdělení hustoty. Hledaný kvantil je t29; 0,95 = 1,70. To znamená, že při platnosti nulové hypotézy je pravděpodobnost, že testové kriterium překročí číslo 1,70 rovna 0,05. Jako obor přijetí vezmeme interval <-∞; 1,70>. Plocha pod křivkou je v oboru přijetí nulové hypotézy rovna 0,95. Obor zamítnutí je (1,70; ). Plocha pod křivkou v oboru zamítnutí je 0,05, což je opět hladina významnosti.

Pro naše data je testové kriterium t rovno 2,45. Protože je v oboru zamítnutí, H0 na 5% hladině významnosti zamítneme.

Velikost p-hodnoty někdy svádí k chybným výrokům o tom, že střední hodnota je více či méně rovna nule a jim podobným. Důvod, proč jsou takové výroky nesmyslné, plyne z toho, že testujeme nulovou hypotézu, to jest zda platí nebo ne, čili výsledkem testování musí být rozhodnutí ve smyslu ano nebo ne. Není nic mezi. Říci, že něco je rovno nule více než něco jiného je nesmysl.