Souhrn - regrese
Regresní analýza má za úkol zjistit, zda náhodná veličina Y závisí na veličinách X1,...,Xn.
Veličinu Y označujeme jako závisle proměnnou.
Veličiny X1,...,Xn jako nezávisle proměnné.
Hodnoty nezávisle proměnných určují hodnotu proměnné závislé.
Obecný zápis regresního modelu: Y = f(x) + ε.
Y... náhodná veličina funkčně závislá na veličině X
ε.... náhodná veličina vyjadřující chyby měření
Regresní modely
Funkce f(x) regresního modelu může mít libovolný tvar:
lineární (např. Y = α+ β x2 + γ z +ε )
nelineární (např. Y =α+x β +ε )
To, zda je model lineární, závisí na tom, jestli jsou lineární jeho parametry a ne na tom, zda jsou lineární proměnné.
Jednoduchá lineární regrese
Jednoduchý lineární regresní model má tvar Y = α+ β x + ε
α,β ... neznámé populační parametry
Regresní přímka má tvar y = a + bx,
kde a je absolutní člen a b je směrnice přímky
a, b... odhady parametrů α,β provedené z výběru
Na přímce leží hodnoty teoretické, předpokládané.
Skutečně naměřené hodnoty y většinou přesně na dané přímce neleží, ale liší se od odpovídající teoretické hodnoty y* na přímce o chybu ε.
Koeficient determinace R2
- ukazuje sílu závislosti náhodné veličiny Y na proměnné X
- nabývá hodnot od 0 do 1
R2= 0 ............ proměnná X vůbec neovlivňuje proměnnou Y
R2= 1 ............ funkční závislost Y na X, což znamená, že všechny naměřené hodnoty leží na přímce
- říká se mu též procento vysvětleného rozptylu, protože poskytuje informaci o tom, jak velká část celkového rozptylu hodnot je vysvětlena regresní přímkou