Modus a problémy s ním spojené

Modus je nejčetnější hodnota.

Je-li dáno intervalové rozdělení četností, vypočítá se modus jako střed intervalu, ve kterém je nejvyšší četnost. Mějme 49 hodnot systolického krevního tlaku (v mm Hg):

120; 121; 123; 134; 128; 137; 114; 126; 141; 127;

119; 120; 122; 133; 136; 127; 125; 113; 126; 140;

121; 122; 124; 135; 129; 138; 115; 127; 142; 128;

129; 143; 129; 117; 139; 131; 137; 126; 124; 123;

132; 119; 112; 114; 149; 133; 111; 122; 144.

 

Rozdělme hodnoty do intervalů o šířce 5 mm Hg :

Interval Absolutní četnosti Relativní četnosti
110-114,9 5 0,102
115-119,9 4 0,082
120-124,9 11 0,224
125-129,9 12 0,245
130-134,9 5 0,102
135-139,9 6 0,122
140-144,9 5 0,102
145-149,9 1 0,020
Celkem 49 0,999

 V našem příkladě je MODUS při rozdělení do intervalů o šířce pět roven číslu (125+130)/2 = 255/2 = 127,5.

Připomeňme si, že horní mez intervalu je 129,9 jen proto, aby se naznačilo, že interval je uzavřený zleva a otevřený zprava, tedy <125;130). Při rozdělení do intervalů o délce deset vypočítáme modus jako (120+130)/2 = 250/2 = 125. Již tento jednoduchý příklad ukazuje, že, i když modus by byl velmi užitečný pro popis dat, je jeho uplatnění omezené. Jeho výpočet závisí na intervalech, které se použijí pro intervalové rozdělení četností. Modus tedy není definován jednoznačně. To ale není ta hlavní těžkost, kterou modus představuje.

Hlavní problém spočívá v tom, že v intervalovém rozdělení četností nemusí být jediné maximum. Které maximum pak pro definici zvolíme, je nejasné. Pokud je maximum jediné, jedná se o data unimodální, pokud jsou maxima dvě, říkáme datům bimodální a jediný MODUS tudíž není definován. Dodejme, že maximum se chápe jako maximum vzhledem k sousedním intervalům, proto zvané lokální maximum. Ta jsou v našem příkladě dokonce tři: 110-114,9; 125-129,9; 135-139,9. Z nich jsme vybrali to největší.

Bimodalita dat často odhaluje skutečnost, že došlo ke smíchání dvou populací unimodálních. To bývá nežádoucí, protože velikosti výběrů z těchto populací jsou často určeny experimentátorem a výsledky pokusů pak mohou odrážet jen to, jakým způsobem si experimentátor velikosti výběrů volil.

Objasnění pojmu modu souvisí s pojmem spojité náhodné veličiny a při definici modu je třeba z toho vycházet. Je velikou chybou považovat hodnotu, která se díky zaokrouhlení opakuje víc než jiná, za četnější a prohlásit ji za modus. V původních datech, která se skládala ze 49 čísel, se nejčastěji opakovalo číslo 137. To ale neznamená, že jej prohlásíme za modus. Modus je třeba spíš vyčíst z relativních četností, případně z histogramu. Opakování jednotlivých hodnot se u kvantitativních dat přičítá zaokrouhlování a tento jev se nebere při výpočtu modu v úvahu. Kdyby k zaokrouhlování nedošlo a bylo by možné měřit naprosto přesně, opakované hodnoty by nevznikly.