1. Úvod do korelační analýzy

Dvourozměrná náhodná veličina

Pro regresní analýzu je typické, že závisle proměnná závisí na nezávisle proměnné prostřednictvím nějaké funkční závislosti a náhodné veličiny, kterou používáme k vyjádření chyby měření. Závisle i nezávisle proměnná jsou jednorozměrné náhodné veličiny. Často taková jednosměrná závislost není vhodná k vystižení vztahů mezi veličinami.

V případě, že očekáváme mezi dvěma proměnnými lineární vztah a nemůžeme tvrdit, že jedna proměnná přímo ovlivňuje hodnoty druhé proměnné, použijeme k vyhodnocení vztahu korelační analýzu. Dosud jsme probírali jednorozměrnou náhodnou veličinu, která se dá nejvhodnějí popsat pomocí svojí hustoty. Znamená to, že pravděpodobnost, že náhodná veličina bude v intervalu <a; b> je rovna ploše pod křivkou hustoty od bodu a do bodu b.

Při korelaci sledujeme spíš společný vývoj obou proměnných. Proto mluvíme o dvourozměrné náhodné veličině. Pro popis dvourozměrné náhodné veličiny, tzn. výskytu různých dvojic čísel, použijeme plochu, které budeme také říkat hustota. Pravděpodobnost, že dvourozměrná náhodná veličina, tedy dvojice čísel, padne do nějaké dvourozměrné oblasti bude úměrná objemu pod plochou. Je to prostá analogie, jsme jen o rozměr výš.

Aby plocha mohla reprezentovat dvourozměrnou hustotu, musí mít vlastnosti, které na ni klade počet pravděpodobnosti. Především musí být plocha jako funkce dvou proměnných nezáporná, aby objemy mezi plochou a rovinou x,y byly nezáporné a mohly se interpretovat jako pravděpodobnosti. Aditivnost ověříme tak, že si uvědomíme aditivnost objemů. Jev jistý musí mít pravděpodobnost rovnu jedné, čili celkový objem pod hustotou musí být roven jedné. Tím jsou požadavky kladené na definici pravděpodobnosti splněny.

(Plochy je nejvhodnější zobrazovat pomocí vrstevnicových map. Mají totiž jen jednu potíž. Ta spočívá v tom, že se nedá rozpoznat, zda se jedná o plochu tvaru kráteru nebo o vrchol. Aby se toto odstranilo, je vždy vhodné před prohlížením vrstevnicové mapy plochy zkontrolovat perspektivní zobrazení plochy pomocí sítě. Představíme si, že na plochu je hozena síť. Při pohledu na tuto síť se pak snadno ujasní, kde jsou vrcholy a kde údolí i u složitějších ploch. Po pochopení tvaru plochy se už věnujeme jen vrstevnicové mapě.)