CHí-kvadrát test

χ2-test

Užívá se tehdy, chceme-li zjistit, zda je mezi pozorovanými četnostmi nějaký vztah, nebo zda pozorované četnosti jsou náhodné. Použijeme ho tehdy, jestliže počet možných výsledků je ≥ 3. Například nás zajímá, zda léčba určitého typu bolesti akupunkturou je účinná. Čtrnáct nemocných udalo, že cítilo zlepšení, čtyřem se potíže zhoršily a tři nezaznamenali žádnou změnu. Testové kritérium se vypočte

\chi ^2 = \sum\limits_{i = 1}^k {\frac{{(O_i - E_i )^2 }}{{E_i }}}

kde k je počet možných výsledků (kategorií), Oi je počet pozorovaných (observed) výskytů v kategorii i a Ei je počet očekávaných (expected) výskytů. V našem příkladu je tedy

Oi 14
3
4
Ei 7
7
7
(O_i - E_i )^2 49
16
9
\chi ^2 = \sum\limits_{i = 1}^k {7+2,286+1,286=10,571}

Hodnotu testového kritéria srovnáváme s kvantily chí kvadrát rozdělení, jehož parametrem je počet stupňů volnosti. Počet stupňů volnosti pro jednovýběrový χ2-test je k – 1, tedy v tomto případě 2. Příslušnou p hodnotu najdeme pomocí funkce CHIDIST. Zjistíme, že odpovídající p-hodnota je 0,0051. Zamítneme tedy H0 a řekneme, že akupunktura je v případě léčby daného typu bolesti účinná.

Nejčastěji se χ2-test používá k testování asociace pozorování v tzv. čtyřpólových tabulkách (tabulka 2 × 2).

Při léčbě dané nemoci ve dvou různých zařízeních dostaneme tyto výsledky:


Vyléčen Nevyléčen
Z1
20
5
Z2
5
5
Existuje statisticky významný rozdíl v úspěšnosti léčby mezi oběma zařízeními? Testové kritérium χ2 je vypočteno jako

\sum\limits_{i = 1}^r {\sum\limits_{j = 1}^k {\frac{{(O_{ij} - E_{ij} )^2 }}{{E_{ij} }},} }

kde i je číslo řádku (r – rows je jich počet) a j je číslo sloupce (k – columns je jejich počet). V daném příkladě r i k = 2 (test lze rozšířit na více sloupců i řádků, obecně mluvíme o tabulkách r × k). Počet stupňů volnosti je (r – 1) × (k – 1), pro čtyřpólovou tabulku je to tedy 1.

Očekávané četnosti (Eij) se vypočítají tak, že pro danou buňku vynásobíme součet četnosti v příslušném sloupci a řádku a tento součin vydělíme celkovým počtem pozorování:


Vyléčen Nevyléčen
EZ1 (25 × 25)/35 (10 × 25)/35
EZ2 (25 × 10)/35 (10 × 10)/35

Po umocnění rozdílu pozorovaných a očekávaných četností a vydělení mocnin příslušnými očekávanými četnostmi dostaneme tabulku


k = 1

k = 2

r = 1 0,257
0,643
r = 2 0,643
1,607

Sečtením hodnot v jejích buňkách dostaneme hodnotu testového kritéria χ2= 3,15. Pomocí funkce CHIDIST zjistíme, že p = 0,0759. Nulovou hypotézu tedy nezamítneme a prohlásíme, že na hladině významnosti 0,05 nelze mezi oběma zařízeními prokázat významný rozdíl.

Při použití χ2 testu srovnáváme diskrétní pozorovaná data (četnosti) s neceločíselnými očekávanými četnostmi. To vnáší do výpočtu určitou chybu. Anglický statistik Yates navrhl korekci výpočtu hodnoty testového kritéria tak, že od absolutní hodnoty rozdílu pozorovaných a očekávaných četností se odečte 0,5.

\chi ^2 = \sum\limits_{i = 1}^k {\frac{{(\left| {O_i - E_i } \right| - 0,5)^2 }}{{E_i }}}

Yatesova korekce se má používat zejména tehdy, kdy celkový počet pozorování je malý (≤ 30). V uvedeném příkladu je p hodnota χ2 testu s Yatesovou korekcí 0,174.

V případě, že četnost v některé buňce čtyřpólové tabulky je menší než pět, se χ2 test nemá používat vůbec a jestliže celkový počet pozorování je kolem stovky, použije se tzv. přesný Fisherův test, který je založen na tom, že pro danou tabulku se spočítají všechny možné kombinace a pravděpodobnost výskytu (p hodnota) je dána podílem tabulek, které obsahují stejné rozložení četností jako má tabulka s pozorovanými výskyty. Pro uvedený příklad je p hodnota Fisherova testu 0,107.