Výklad - spojitá náhodná veličina
Úvod do problematiky
Rozdělení pravděpodobnosti- spojité náhodné veličiny
Spojité náhodné veličiny
Spojité náhodné veličiny jsou ty, jejichž hodnotami jsou reálná čísla v nějakém intervalu, případně všechna reálná čísla, to jest čísla libovolně velká od minus nekonečna do nekonečna. Všechna reálná čísla v nějakém intervalu není možné očíslovat pomocí celých čísel. Proto ani není možné použít stejné postupy jako u diskrétních náhodných veličin.
Aniž bychom mohli vyjmenovat všechny hodnoty, kterých náhodná veličina nabývá, můžeme stanovit, jaká je pravděpodobnost, že hodnoty budou v nějakém intervalu, řekněme <a,b). To umožňuje přistoupit ke spojitým náhodným veličinám, které označujeme zásadně velkými písmeny, například X nebo Y a chceme se tedy zabývat pravděpodobností
P(a ≤ X < b).
Na takové obecné úrovni se přiřazení pravděpodobností intervalům říká zákon rozdělení, zkráceně rozdělení.
Naznačené intervaly jsou zleva uzavřené a zprava otevřené. Podobně tomu bylo u intervalových rozdělení četností. Tím hned vidíme souvislost mezi spojitými náhodnými veličinami, kde hovoříme o pravděpodobnostech, a kvantitativními daty, kde se hovořilo o relativních četnostech. Jestliže máme dva sousední intervaly<a,b) a <b,c), vidíme, že jsou disjunktní a jejich sjednocením je zase interval <a,c) .
Pomocí pravděpodobnosti, že náhodná veličina bude v nějakém intervalu, jsme mohli popisovat i diskrétní náhodné veličiny. Neudělali jsme to jen proto, že zavedení takové otázky by se zdálo neúčelné.
Pravděpodobnost, že spojitá náhodná veličina padne do nějakého intervalu <a,b) se popisuje pomocí funkce, která se nazývá hustota. Pravděpodobnost, že náhodná veličina s danou hustotou h padne do intervalu <a,b), se určí jako plocha mezi osou x a grafem hustoty h nad intervalem <a,b). Tomu se krátce říká plocha pod křivkou. Přitom se samozřejmě předpokládá, že tato plocha je zdola omezena osou x, jinak by byla nekonečnou.
Abychom mohli hovořit o pravděpodobnostech, musí hustota být především funkcí nezápornou. Jevem jistým je množina všech reálných čísel, musí tedy být celková plocha pod křivkou hustoty rovna jedné. Tím je míněna plocha od minus nekonečna do nekonečna. Těm, kteří nestudovali limity, stačí chápat pojem plochy pod křivkou hustoty od minus nekonečna do nekonečna jen intuitivně. Ti, kteří studovali limity, tomu mají rozumět tak, že pro libovolný interval <a,b) je plocha pod křivkou hustoty menší nebo rovna jedné, ale zároveň je možné nalézt intervaly takové, že plocha se blíží jedné.
Jak bylo již probráno v geometrické definici pravděpodobnosti, je možné obsahy ploch pokládat za aditivní, tedy plochy pod křivkou hustoty je možné použít k definici pravděpodobnosti.
V případě histogramu se daným intervalům vypočítávají relativní četnosti a těm jsou úměrné plochy obdélníků. Plocha obdélníku se vypočítá jako délka intervalu krát výška obdélníku. Pro histogram relativních četností je celková plocha histogramu rovna jedné. Relativní četnosti zobrazené jako plochy je možné vyjadřovat výškou. V tomto smyslu je možné histogram považovat za hustotu rozdělení nebo spíš předchůdce hustoty.
Lokální vlastnosti (nepovinné)
Zvolíme-li velmi malý interval, do kterého má náhodná veličina X s hustotou h padnout, víme, že pravděpodobnost tohoto jevu je rovna ploše pod hustotou v tomto intervalu.
Jestliže platí Min ≤ h(x)≤ Max pro všechna x v <a,b), pro plochu P pod hustotou platí
Min(b-a)≤ P≤ Max(b-a)
Tato úvaha nás opravňuje očekávat, že pravděpodobnost padnutí náhodné veličiny do takového intervalu bude úměrná délce intervalu a hustotě v tomto intervalu.
Ve fyzice je hustota definována jako hmotnost vztažená k objemu v případě homogenní látky. Připomeňme, že hmotnost i objem jsou funkce množinové.
V případě látky nehomogenní je nutno zavést funkci hustoty jako bodovou funkci, která říká, jaký je poměr hmotnosti ku objemu velmi malému, ale obsahujícímu daný bod. Je tu jasná analogie mezi hustotou v počtu pravděpodobnosti a hustotou ve fyzice.
Vhodnější je zajímat se o hustotu tyče definovanou jako hmotnost vztaženou k délce tyče. Pokud je tyč homogenní, je hustota podílem hmotnosti a délky. Pokud je ale tyč nehomogenní, například tím, že má nestejný průřez, i když ze stejné látky, definujeme hustotu tyče v nějakém bodě jako poměr hmotnosti nějakého velmi malého intervalu na tyči k délce tohoto intervalu. Tím dostaneme přesnější analogii hustoty spojitého rozdělení.
Rovnoměrné rozdělení
O spojité náhodné veličině říkáme, že má rovnoměrné rozdělení, když nabývá hodnot jen v nějakém intervalu a hustota je v tomto intervalu konstantní.
Jestliže náhodná veličina nabývá hodnot jen v intervalu <a,b) , pak je hustota mimo tento interval nulová.
Jestliže je v intervalu <a,b) hustota konstantní, pak pravděpodobnost, že náhodná veličina padne do intervalu <a,b) je rovna ploše pod křivkou hustoty, což je h(b-a). Tato plocha musí být rovna jedné (je to jev jistý), tedy h(b-a) = 1, což dá h = 1/(b-a). Z toho je vidět, že rovnoměrné rozdělení je plně určeno intervalem, do kterého náhodná veličina padne, protože hustota je tím už určena.
Příklad: Vypočtěme pravděpodobnost, že náhodná veličina s rovnoměrným rozdělením v intervalu<a,b) padne do pravé půlky tohoto intervalu. Intuitivně víme, že to bude 1/2. Střed intervalu je v bodě (a+b)/2 a hustota h=1/(b-a). Plocha pod hustotou je délka intervalu krát hustota, (b-(a+b)/2)/(b-a)=1/2.
Zaokrouhlování jako náhodná veličina (nepovinné)
Jestliže víme, že nějaké celé číslo K vznikne zaokrouhlením, můžeme ještě předpokládat, že původní číslo bylo v intervalu <K - 0,5; K + 0,5), a že v tomto intervalu mělo rovnoměrné rozdělení. Všimněme si opět, že i ten obvyklý způsob zaokrouhlování souhlasí s naším způsobem psaní intervalů zleva uzavřených a zprava otevřených. Hustota pravděpodobnosti h(x) bude definována jako jedna pro x v intervalu <K - 0,5; K + 0,5) a jako nula pro x mimo tento interval.
Symetrické rozdělení
Definice: Spojité rozdělení se nazývá symetrické kolem nějakého středu symetrie µ, jestliže pro jeho hustotu platí
h(µ + x) = h(µ - x) .
Tato definice se opírá o celkem jasný geometrický názor. Také je hodně uplatňována v praxi. Jestliže například chceme říci, že chyby měření jsou "jak kladné, tak záporné asi tak stejně," matematicky se to vyjádří pomocí pojmu symetrie.
Například rovnoměrné rozdělení na intervalu <a,b) je symetrické kolem středu intervalu <a,b) , to jest bodu (a+b)/2.
Nesymetrická rozdělení
Asymetrickým rozdělením se též říká zešikmená. V praxi hovoříme o zešikmeném rozdělení vzhledem k modu, tj. bodu, ve kterém hustota nabývá maxima.
Rozlišujeme rozdělení zešikmené vpravo a zešikmené vlevo.
Pro ilustraci uvádíme následující zjednodušené definice.
Rozdělení zešikmené vpravo má tu vlastnost, že hustota vpravo od modu je větší než hustota vlevo od modu. To znamená, že hustota v libovolném bodě vpravo od modu je větší než hustota v bodě stejně vzdáleném od modu vlevo.
To je možné zapsat jako h(m-x)<h(m+x), kde h je hustota, m je modus a x je kladné číslo.
Rozdělení zešikmené vlevo má tu vlastnost, že hustota v libovolném bodě vlevo od modu je větší než hustota v bodě stejně vzdáleném od modu vpravo.
To je možné zapsat jako h(m-x)>h(m+x), kde h je hustota, m je modus a x je kladné číslo.
Rozdělení tvaru U a J
V praxi se někdy vyskytují rozdělení, která nejsou zvonovitá. Tím je myšleno, že graf hustoty má například tvar písmene U nebo J.
Příkladem je poruchovost zařízení. Při uvádění do provozu mívá zařízení obvykle vysokou poruchovost. Důvodem mohou být nedostatky při výrobě. Po zaběhnutí bývá poruchovost zařízení nízká. Později se opět zvyšuje opotřebením.
Podobně je to s analýzou přežití. V dospělosti je pravděpodobnost úmrtí menší, než v dětství nebo ve stáří.