Znaménkový test

Metody používané v kapitolách 3. – 5. v předcházejícím textu předpokládají, že data, která testujeme, pocházejí z populace, která má gaussovské rozdělení. Všechny  metody, splňující tento předpoklad, se nazývají parametrické a statistika s nimi spojená se nazývá statistika parametrická. Připomeňme si, že Gaussovo rozdělení předpokládá, že data jsou spojitá a mohou nabývat hodnot od -∞ do +∞. Předpoklad spojitosti dat lze často použít nebo přijmout (tlak krve, hladiny léků v plasmě). S předpokladem intervalu od -∞ do +∞ je to však v medicíně a biologii horší. Většina biologicky důležitých proměnných je pravostranně sešikmená, to znamená, že minimální hodnoty, kterých tyto veličiny mohou nabývat, jsou limitovány hodnotami slučitelnými se životem. Menší hodnoty se v pozorovaných datech vyskytovat nemohou, zatímco hodnoty vyšší než je fyziologická horní mez, se vyskytují.

Řada veličin, které chceme analyzovat, i když jsou kvantitavní nejsou spojitá anebo jsou to data ordinální. Metody, které umožňují testování vlastností takovýchto dat, se nazývají metody neparametrické. Řada z nich nepředpokládá žádné teoretické rozdělení pravděpodobnosti (jsou to tzv. distribution-free metody). Vyložíme si postupy tří různých skupin neparametrických testů: znaménkového testu, testů pořadových a na závěr tzv. χ2 (chí kvadrát) testu.

 Znaménkový test použijeme v případě, kdy jsou data ordinální nebo jsou spojitá a nemají Gaussovo rozdělení nebo teoreticky předpokládáme, že Gaussovo rozdělení mít nemohou. Jako příklad uveďme analýzu doby odezvy pohotovostní služby na volání nemocných. Vyhláška Ministerstva zdravotnictví předpokládá, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému jsou uvedeny v tabulce:

doba příjezdu (min): 15 23 11 20 18 32 30 24 26 17

 Provedeme-li testování normality daných dat, zjistíme, že nulovou hypotézu zamítnout nemůže. Proto k nalezení odpovědi na otázku, zda je doba dojezdu delší, než je požadavek vyhlášky, použijeme jednovýběrový test hypotézy o průměru s jednostrannou alternativní hypotézou, že doba dojezdu je delší než 17 min. Pravděpodobnost platnosti nulové hypotézy (doba dojezdu v tomto výběru se neliší od vyhláškou požadovaných 17 min) je rovna 0,0283, tedy menší než standardně používaná hodnota 0,05. Zamítneme nulovou hypotézu a prohlásíme, že doba dojezdu k pacientovi je statisticky významně vyšší než předpokládá zmíněná vyhláška.

Zamyslíme-li se nad analyzovanou veličinou, dospějeme jednoznačně k závěru, že doba dojezdu musí být pravostranně vychýlená a i když se nepodařilo zamítnout nulovou hypotézu na těchto datech, je logicky správnějším postupem použít neparametrický test. Obdobou jednovýběrového testu hypotézy o průměru je test znaménkový. Ten je vlastně binomickým testem, který předpokládá, že pravděpodobnost obou možných výsledků pozorování A a B je stejná, tedy

p(A) = p(B) = 0,5

V uvedených datech označíme znaménkem mínus doby delší než je předpokládaná doba vyhlášky, znaménkem plus ty případy, kdy doba dojezdu byla kratší. V případě, že se doba dojezdu shoduje s dobou uvedenou ve vyhlášce, nebudeme tento ve znaménkovém testu počítat. Celkový počet údajů se tak sníží na 9 a z těchto devíti případů byla doba dojezdu dvakrát kratší než je doba požadovaná. Jednostranná alternativní hypotéza znaménkového testu udává hodnotu pravděpodobnosti 0,0898, tedy číslo větší než je 0,05. Proto nemůžeme zamítnout nulovou hypotézu a řekneme, že se nepodařilo prokázat, že doba dojezdu z analyzovaných dat se statisticky významně liší od doby požadované vyhláškou. Uvedený příklad také ukazuje na obecnou vlastnost neparametrických testů, to je skutečnost, že jsou k zjištění rozdílu méně citlivé. Síla neparametrických testů je obecně při stejném počtu pozorování menší, než je síla ekvivalentních testů parametrických. Zvýšení síly testu dosáhneme zvýšením počtu pozorování.

 V dalším příkladu použijeme znaménkový test jako neparametrickou variantu párového t-testu.

Před cvič. (s) 87 61 98 90 93 74 83 72 81 75 83

Po cvič. (s)  50 45 79 90 88 65 52 79 84 61 52

V tabulce jsou uvedena data doby řešení matematického příkladu skupinou 11 studentů před speciálním cvičením zaměřeným na daný typ úloh. V druhém řádku tabulky jsou doby potřebné k řešení obdobného příkladu po praktickém cvičení. Výsledek testu normality diferencí dob před a po cvičení říká, že p hodnota je rovna 0,578 a nemůžeme tedy nulovou hypotézu zamítnout a k nalezení odpovědi na otázku použijeme párový t-test.Ten pro jednostrannou alternativní hypotézu předpokládající, že doba před cvičením je větší, než doba po cvičení dává p hodnotu 0,0055. Zamítneme tedy nulovou hypotézu a prohlásíme, že speciální praktické cvičení vede ke zkrácení doby řešení.

Z psychologie však víme, že doby řešení úloh po cvičení orientovaném na určitý typ úloh mají levostranně sešikmené rozdělení a použití párového t-testu není tedy teoreticky správné, a proto k nalezení odpovědi na otázku použijeme znaménkový test. Znaménkem plus označíme ty hodnoty, kdy se po cvičení doba k řešení příkladu zkrátila, znaménkem mínus ty případy, kdy naopak doba potřebná k řešení příkladu byla delší. Pokud je diference v dobách řešení nulová, jde o tzv. svázané hodnoty (ties) a o ně počet analyzovaných údajů snížíme. V tomto příkladu to je výsledek jednoho studenta, takže celkový počet analyzovaných dat se sníží na deset párů a počet úspěchů je 8. Výsledek znaménkového testu pro jednostrannou alternativní hypotézu je, že p se rovná 0,0547. Nemůžeme tedy nulovou hypotézu zamítnout a prohlásíme, že nepodařilo prokázat, že dané cvičení vede ke zkrácení doby řešení tohoto druhu příkladů.