Dělení znaků

Při získávání dat často provádíme tyto činnosti:

1. Klasifikaci

- Zařazení prvku do jedné ze dvou nebo více podskupin podle hodnoty zvoleného znaku

Př.: znak : rodinný stav

podskupiny: svobodný, ženatý (vdaná), rozvedený, vdovec (vdova)

2. Uspořádání

Vyjádření hodnoty znaku ve stupnici vytvořené podle předem dohodnutých pravidel

Př.: bodové ohodnocení závažnosti poranění

Stupnice může být tvořena čísly, písmeny abecedy nebo počtem křížků (+)

3. Měření

Hodnotě znaku se přiřadí odpovídající hodnota na číselné ose

Př.: teplota, tlak krve

Klasifikace, uspořádání a měření je proces přiřazování určitého kódu (většinou čísla) nějakému znaku, tj. vlastnosti sledovaného děje nebo pozorovaných objektů. Podle toho, jaká pravidla pro přiřazení kódu výsledkům měření nebo pozorování použijeme, je můžeme zobrazit na různých měrných stupnicích (škálách).

Nejprve se ale věnujme jednotlivým typům znaků.

Znaky, tj. vlastnosti statistických jednotek, můžeme dělit různými způsoby.

Přehled dělení znaků uvádí následující obrázek.

Znaky určující

- umožňují rozpoznat, zda prvek do souboru patří nebo ne


Znaky zkoumané

- znaky, které vyšetřujeme


Chceme-li zpracovat výsledky měření nebo pozorování, musíme správně rozlišit, jaký typ znaku zkoumáme, abychom pro zpracování výsledků vybrali odpovídající metodu.

Proto podle S. S. Stevense (známého také jako autora mocninové závislosti počitu na podnětu) znaky dělíme do těchto skupin:

1. Znaky nominální

- mohou nabývat dvou (binární znaky) nebo více hodnot (množné znaky), ale nemá smysl mezi sebou porovnávat velikost těchto hodnot


Př.: znak binární: pohlaví, kuřák/nekuřák

znak množný: zaměstnání, rodinný stav, mezinárodní klasifikace nemocí


2.·Znaky pořadové (= ordinální)

- kategorie znaku lze mezi sebou porovnávat a určit jejich pořadí, ale nemá smysl provádět s nimi aritmetické operace, např. určovat jejich rozdíl

Př.: závažnost poranění: těžké, stření, lehké

spokojenost pacienta s léčbou: velmi spokojen, spíše spokojen, spíše nespokojen, nespokojen

3.·Znaky intervalové

- lze určit velikost rozdílu mezi libovolnými dvěma hodnotami znaku, ale nemá význam určovat jejich podíl

Př.: teplota ve stupnici Celsiově; mezi teplotou -10 °C a teplotou +10 °C je rozdíl 20 °C, ale podíl teplot = -1 nemá žádný smysl


4.·Znaky poměrové

- podíl dvou různých hodnot má reálný význam

Př.: osoba s hmotností 100 kg je dvojnásobně těžká než osoba s hmotností 50 kg.

Jiné dělení hodnot znaků je na

Kvantitativní data, tj. číselná vyjádření hodnoty znaku, mohou být

  • nespojitá (diskrétní)
  • spojitá

Nespojitá data jsou celá čísla a obvykle uvádějí počet (např. počet dětí v rodině, počet trombocytů). Spojitá data mohou nabývat libovolné hodnoty v určitém intervalu. Přesto často mají, vzhledem k rozlišení použité metody, charakter dat diskrétních (např. věk v rocích, tlak krve měřený tonometrem). Kvantitativní data někdy transformujeme na data ordinální (např. nízký, normální, vysoký krevní tlak; mikrocyt, normocyt, makrocyt).

Data kategorická jsou jejich opakem. Vyjádřují se pomocí hodnot znaků nominálních.

Data vyjádřená v ordinálních stupnicích se někdy nazývají jako semikvantitavní.