Výklad - neparametrické testy
- Znaménkový test - Wilcoxonův párový test - Mannův-Whitneyův test - Spearmanův korelační koeficient - Chí-kvadrát test
CHí-kvadrát test
χ2-test
Užívá se tehdy, chceme-li zjistit, zda je mezi pozorovanými četnostmi nějaký vztah, nebo zda pozorované četnosti jsou náhodné. Použijeme ho tehdy, jestliže počet možných výsledků je ≥ 3. Například nás zajímá, zda léčba určitého typu bolesti akupunkturou je účinná. Čtrnáct nemocných udalo, že cítilo zlepšení, čtyřem se potíže zhoršily a tři nezaznamenali žádnou změnu. Testové kritérium se vypočte
kde k je počet možných výsledků (kategorií), Oi je počet pozorovaných (observed) výskytů v kategorii i a Ei je počet očekávaných (expected) výskytů. V našem příkladu je tedy
Hodnotu testového kritéria srovnáváme s kvantily chí kvadrát rozdělení, jehož parametrem je počet stupňů volnosti. Počet stupňů volnosti pro jednovýběrový χ2-test je k – 1, tedy v tomto případě 2. Příslušnou p hodnotu najdeme pomocí funkce CHIDIST. Zjistíme, že odpovídající p-hodnota je 0,0051. Zamítneme tedy H0 a řekneme, že akupunktura je v případě léčby daného typu bolesti účinná.
Nejčastěji se χ2-test používá k testování asociace pozorování v tzv. čtyřpólových tabulkách (tabulka 2 × 2).
Při léčbě dané nemoci ve dvou různých zařízeních dostaneme tyto výsledky:
| Vyléčen | Nevyléčen | |
| Z1 |
20 |
5 |
| Z2 |
5 |
5 |
kde i je číslo řádku (r – rows je jich počet) a j je číslo sloupce (k – columns je jejich počet). V daném příkladě r i k = 2 (test lze rozšířit na více sloupců i řádků, obecně mluvíme o tabulkách r × k). Počet stupňů volnosti je (r – 1) × (k – 1), pro čtyřpólovou tabulku je to tedy 1.
Očekávané četnosti (Eij) se vypočítají tak, že pro danou buňku vynásobíme součet četnosti v příslušném sloupci a řádku a tento součin vydělíme celkovým počtem pozorování:
| Vyléčen | Nevyléčen | |
| EZ1 | (25 × 25)/35 | (10 × 25)/35 |
| EZ2 | (25 × 10)/35 | (10 × 10)/35 |
Po umocnění rozdílu pozorovaných a očekávaných četností a vydělení mocnin příslušnými očekávanými četnostmi dostaneme tabulku
|
k = 1 |
k = 2 |
|
| r = 1 | 0,257 |
0,643 |
| r = 2 | 0,643 |
1,607 |
Sečtením hodnot v jejích buňkách dostaneme hodnotu testového kritéria χ2= 3,15. Pomocí funkce CHIDIST zjistíme, že p = 0,0759. Nulovou hypotézu tedy nezamítneme a prohlásíme, že na hladině významnosti 0,05 nelze mezi oběma zařízeními prokázat významný rozdíl.
Při použití χ2 testu srovnáváme diskrétní pozorovaná data (četnosti) s neceločíselnými očekávanými četnostmi. To vnáší do výpočtu určitou chybu. Anglický statistik Yates navrhl korekci výpočtu hodnoty testového kritéria tak, že od absolutní hodnoty rozdílu pozorovaných a očekávaných četností se odečte 0,5.
Yatesova korekce se má používat zejména tehdy, kdy celkový počet pozorování je malý (≤ 30). V uvedeném příkladu je p hodnota χ2 testu s Yatesovou korekcí 0,174.
V případě, že četnost v některé buňce čtyřpólové tabulky je menší než pět, se χ2 test nemá používat vůbec a jestliže celkový počet pozorování je kolem stovky, použije se tzv. přesný Fisherův test, který je založen na tom, že pro danou tabulku se spočítají všechny možné kombinace a pravděpodobnost výskytu (p hodnota) je dána podílem tabulek, které obsahují stejné rozložení četností jako má tabulka s pozorovanými výskyty. Pro uvedený příklad je p hodnota Fisherova testu 0,107.




