Kvantily

Obdoba mediánu

Při definici mediánu můžeme říci, že chceme, aby počet hodnot pod mediánem byl stejný jako počet hodnot nad mediánem. Zhruba řečeno polovina pod a polovina nad a definice se upřesní pro N sudé a pro N liché.

Kvartily

Když chceme, aby byla čtvrtina hodnot pod a tři čtvrtiny nad, hovoříme o prvním kvartilu, druhý kvartil je pak medián a třetí kvartil znamená tři čtvrtiny pod a čtvrtina nad. Kvartily jsou tři a rozdělují hodnoty na čtyři části.

Decily

Chceme-li hodnoty rozdělit na deset částí, použijeme decily.

Obecně se užívá pojem kvantily, poměr dělení může být libovolný, často se ale také mluví o percentilech, a to když se dělení udává v procentech.

K přesnější definici kvantilů užijeme obdobný postup jako pro medián. Když máme k dispozici N čísel a máme vypočítat medián, zjistíme nejprve, zda N je sudé nebo liché. To hodnotíme podle toho, zda N/2 je číslo celé nebo ne.

V případě kvantilu stejným způsobem vypočteme Np, kde p je předpokládaný podíl hodnot před kvantilem. Pro medián by bylo p=1/2, pro první kvartil by bylo p=1/4, pro třetí kvartil p=3/4, pro čtvrtý decil p=4/10.

V případě percentilů se jen přizpůsobíme procentům, takže pro K-procentní percentil je vzorec NK/100. Pokud vyjde číslo celé, postupujeme jako u mediánu tak, že vezmeme střed intervalu .

Analogie mediánu

Pamatuje se to snadno jednak jako analogie mediánu, jednak tak, že si vzorec vyzkoušíme na čtyřech číslech, stejně jako u mediánu. Střed intervalu se pak vypočte jako průměr krajních hodnot intervalu. Jestliže Np není celé číslo, zaokrouhlí se na celé číslo nahoru, což se obvykle značí H= \lceilNp\rceil, a jako kvantil se bere hodnota x(H) . (Toto označení pro zaokrouhlení na celé číslo nahoru se snadno pamatuje, protože připomíná strop. Naopak zaokrouhlení nějakého čísla na celé číslo dolů by se značilo jako podlaha).

Je dobré si všimnout, že postup výpočtu je obdobný jako u mediánu.

Můžeme si zkontrolovat předchozí vzorec pro medián proti vzorci používanému pro kvantily. Pro jednoduchost předpokládejme, že N je liché. Pak medián je číslo x((N+1)/2) . Když N je liché, není N/2 celočíselné a pro výpočet kvantilu musíme zaokrouhlit na celé číslo nahoru. To se provede přičtením poloviny: N/2+1/2, což je rovno (N+1)/2, tedy totéž jako původní vzorec pro medián. Podobně je možné zkontrolovat vzorec pro medián pro sudé N.

Výpočet kvantilů

Pro výpočet je nejvýhodnější čísla setřídit vzestupně podle velikosti, případně k nim připsat pořadí.

Zkusíme dva příklady:

Příklad 1: Nejprve zvolíme lichý počet N = 7 a máme určit kvartily pro čísla 7,2; 7,0; 7,4; 7,1; 7,8; 7,2; 7,3. Nejprve je uspořádáme podle velikosti vzestupně 7,0; 7,1; 7,2; 7,2; 7,3; 7,4; 7,8.

Chceme vypočítat první kvartil K1 (= P25).

N(1/4) = 7/4 = 1,75, což po zaokrouhlení nahoru je 2. Takže K1 = x(2) = 7,1.

Druhý kvartil je totéž jako medián či 50. percentil. N(2/4) = 7(2/4) = 3,5 po zaokrouhlení nahoru 4. Výsledek je: K2 = x(4) = 7,2.

Pro třetí kvartil K3 vypočteme N(3/4) = 7(3/4) = 5,25 po zaokrouhlení nahoru 6. Výsledek je K3 = x(6) = 7,4.

Příklad 2: Nyní volíme sudý počet N = 8 čísel 9,2; 9,8; 9,9; 8,3 8,8; 8,1; 9,7; 9,0. Po uspořádání dostaneme 8,1; 8,3; 8,8; 9,0; 9,2; 9,7; 9,8; 9,9.

Vypočítáme K1 jako první kvartil. N(1/4) = 8/4 = 2, což je celé číslo. Vypočteme střed intervalu (x(2); x(3))=(8,3; 8,8), takže K1 = (8,3 + 8,8)/2 = 8,55.

Druhý kvartil K2 je totéž jako medián. N(2/4) = 8(2/4) = 4. Střed intervalu je K2 = 9,1.

Pro třetí kvartil K3 vypočteme N(3/4) = 8(3/4) = 6. Střed intervalu pak bude K3 = 9,75.

Jiné postupy pro výpočet kvantilů

Tato poznámka je zde jen proto, že některé programy počítají kvantily odlišným způsobem a dávají jiné výsledky. Zde uvedený postup byl zvolen hlavně kvůli analogii s mediánem. Existují i jiné postupy, ty jsou ale trochu komplikovanější pro výpočet a tudíž nevhodné pro ruční počítání. Počítače snadno mohou použít i složitější metody a výsledek může být trochu odlišný od výsledku získaného výše popsanou metodou. Nejčastěji se asi používá lineární interpolace, kterou se zde nebudeme zabývat, protože numericky je rozdíl nepodstatný.