Popisná statistika v Excelu

V aplikaci Microsoft Excel je k dispozici sada nástrojů pro analýzu dat nazvaná Analytické nástroje, která umožňuje provádět statistické. Při použití některého z těchto nástrojů zadáte data, která chcete analyzovat, a příslušné parametry, daný nástroj použije makro odpovídající statistické funkce a potom zobrazí výsledky ve výstupní tabulce. Některé nástroje vytvářejí kromě výstupních tabulek také grafy.

Některé ze statistických funkcí jsou definovány přímo z excelovského listu (po napsání = se klikne na symbol fx), jiné jsou k dispozici až po nainstalování doplňku Analytické nástroje. Přístup k těmto nástrojům získáte klepnutím na příkaz Analýza dat v nabídce Nástroje. Pokud není příkaz Analýza dat k dispozici, bude třeba doplněk Analytické nástroje zavést:

  1. V nabídce Nástroje klepněte na příkaz Doplňky.

  2. V seznamu Doplňky k dispozici zaškrtněte políčko u položky Analytické nástroje a klepněte na tlačítko OK.

  3. V případě potřeby postupujte podle pokynů k instalačnímu programu.

  4. V dialogovém okně Analýza dat klepněte na název analytického nástroje Popisná statistika, a potom klepněte na tlačítko OK.

  5. V dialogovém okně nastavte požadované možnosti analýzy:

Vstupní oblast, Sloupce, Popisky v prvním řádku, Výstupní oblast

Další informace o těchto možnostech získáte v dialogovém okně klepnutím na tlačítko Nápověda.

Pro ilustraci podrobně popíšeme řešení dvou příkladů z kapitoly 1 a 2 Biostatistika – Základní kurz (Charakteristiky polohy – střední hodnota; Charakteristiky variability). Výsledky těchto řešení jsou uvedeny v souboru Char_pol_variab_moodle.xls na listech polohy a variab.


Příklad 030104:


U 15 pacientů byly změřeny hladiny cholesterolu v krvi (v mmol/L): 5; 7; 6; 5; 8; 6; 6; 4; 10; 5; 11; 6; 4; 6; 7. Vypočtěte průměr, medián, modus, 1. a 3. kvartil a 1.a 9. decil.


Postup:

  1. Vstupní data přeneseme do excelovské tabulky tak, že provedeme jejich transpozici (z řádku do sloupce) s tím, že první údaj bude v buňce A2

  2. Do buňky A1 napíšeme rozměr měřené veličiny (mmol/L)

  3. Data seřadíme vzestupně (je to nutné kvůli výpočtu příslušných kvantilů pomocí funkcí Quartil a Percentil)

  4. V nabídce Nástroje vybereme činnost Analýza dat

  5. V okně Analýza dat vybereme nástroj Popisná statistika

  6. V okně Popisná statistika klikneme na čtvereček v položce Vstupní oblast a do otevřeného podokna zadáme buňky A1:A16 a klikneme na čtvereček na pravém konci

  7. V možnosti Sdružit zvolíme Sloupce

  8. Zaškrtneme Popisky v prvním řádku

  9. V Možnosti výstupu zvolíme Výstupní oblast a klikneme čtvereček na pravém konci a v otevřeném podokně zadáme buňku D1 (klikneme na ni) a kliknutím na čtvereček na pravém konci se vrátíme možnostem nastavení

  10. Zvolíme Celkový přehled a klikneme na OK

  11. V buňce

  12. Charakteristiky, které požaduje zadání příkladu, zformátujeme na řez písma tučné.


Výsledek se zapíše do pole D1:E15 (pro přehlednost tyto dva sloupce rozklikneme). Vzhledem k nestandardnímu překladu názvů charakteristik do češtiny jsou ve sloupci B v příslušných buňkách uvedeny správné české termíny, v sloupci C odpovídající symboly. Vypočtené charakteristiky variability jsou výběrové.


Dalším požadavkem zadání je výpočet 1. a 3. kvartilu a 1.a 9. decilu. To provedeme pomocí výše zmíněných funkcí takto:

  1. Do volné buňky v tabulce napíšeme rovnítko (v souboru s řešením je to buňka H3)

  2. Klikneme na symbol fx

  3. v okně Vložit funkci vybereme kategorii Statistické a nejdeme Quartil

  4. Klikneme na OK, do podokna Pole zadáme vstupní oblast, A2:A16, do podokna Kvartil 1. Klikneme na OK a v buňce H3 se zobrazí hodnota 1. kvartilu.

  5. Pro třetí kvartil výpočet zopakujeme s tím rozdílem, že do podokna Kvartil napíšeme 3

  6. Statistické funkce v Excelu nenabízejí možnost přímého výpočtu decilů. Požadované hodnoty vypočteme proto pomocí funkce Percentil tak, že do podokna K pro výpočet prvního decilu napíšeme 0,1 (10. percentil = 1. decil) a v druhém výpočtu 0,9 (90. percentilu = 9. decil)


Pokud jde zobrazení platných cifer, je Excel nastaven tak, že výpočty provádí s přesností 15 platných číslic a pokud je formát buňky Obecný, zobrazuje se 11 platných číslic (pokud výsledek výpočtu má tento počet číslic) Vzhledem k tomu, co počtu platných číslic víme, je nutné povést zaokrouhlení na takový počet platných číslic, kolik jich mají vstupní data. Protože vstupní data v uvedeném příkladu nemají žádné desetinné místo, je správné stejně zaokrouhlit i vypočítané charakteristiky. To je v uvedeném příkladu ve sloupci F.


Ve sloupci J jsou uvedeny anglické ekvivalenty českých výrazů ze sloupce D.


Příklad 030203:


U 11 pacientů byly změřeny následující hladiny cholesterolu v krvi (mmol/L): 5; 7; 9; 5; 8; 6; 6; 4; 10; 5; 12. Vypočtěte variační, kvartilové a decilové rozpětí, výběrový rozptyl, výběrovou směrodatnou odchylku a variační koeficient.

Postup:

  1. Jediný rozdíl proti předešlému příkladu je v tom, že data (včetně jednotky veličiny jsou v buňkách A1:A12.

  2. V buňkách F3 a G3 vypočteme hodnoty 3. a 1. kvartilu. Jejich rozdíl je kvartilové rozpětí (E3)

  3. V buňkách F4 a G4 vypočteme hodnoty 9. a 1. decilu. Jejich rozdíl je decilové rozpětí (E4)

  4. V buňce C 18 vypočteme variační koeficient v % jako podíl (výběrové) směrodatné odchylky a aritmetického průměru vynásobený 100. Výsledek zaokrouhlíme na tři platné číslice.