Nezávislost jevů

Nezávislé jevy

Je dána základní množina S a dvě její podmnožiny A a C. Pro pravděpodobnost předpokládejme, že P(A)>0 a P(C)>0. To, že pravděpodobnost jevu A nezávisí na podmínce C vyjádříme pomocí podmíněné pravděpodobnosti jako P(A)=P(A/C), čili pravděpodobnost jevu A není ovlivněna podmínkou C. Jelikož P(A/C) = P(A ∩ C)/P(C), můžeme nezávislost jevu A na podmínce C zapsat jako P(A) = P(A ∩ C)/P(C), což je totéž jako P(A)P(C) = P(A∩ C).

Obráceně, to, že C nezávisí na A, zapíšeme jako P(C) = P(A ∩ C)/P(A), což je totéž jako

P(A)P(C) = P(A∩C).

Jak je vidět, je podmínka pro nezávislost A na C totožná s podmínkou pro nezávislost C na A. To znamená, že můžeme říkat, že jevy A a C jsou nezávislé.

Když chceme ověřit, jestli dva jevy jsou nezávislé, stačí ověřit jen jednu ze tří uvedených podmínek a další dvě z toho plynou. Samozřejmě musí být P(A)>0 a P(C)>0.


Vyzkoušíme to na příkladě: P(A) = 0,28; P(AB) = 0,07 a P(B) = 0,25.

P(A/B) = P(A∩B)/P(B) = 0,07/0,25 = 0,28, což je rovno P(A).

P(B/A) = P(A∩B)/P(A) = 0,07/0,28 = 0,25, což je rovno P(B).

P(A).P(B) = 0,28.0,25 = 0,07, což je rovno P(A∩B).

Ověřili jsme tři podmínky, ale stačilo ověřit jen jednu z nich a už bychom bez dalšího počítání věděli, že další dvě podmínky musí být také splněny.


Doplňkové podmínky pro nezávislost (nepovinné)

Jestliže řekneme, že jev A má stejnou pravděpodobnost nezávisle na tom, že nastal jev B, je to totéž jako že nenastal jev B, že nastal doplněk nonB jevu B. Tato podmínka nezávislosti na nonB se dá zapsat jako P(A) = P(A/nonB) = P(A ∩ nonB)/P(nonB). Když S značí jev jistý a 0<P(B)<1, přepíšeme podmínku jako

P(A) = P(A ∩(S-B))/P(S-B) = P(A-AB)/(1-P(B)) = P(A)-P(A B)/(1-P(B)).

Rovnost platí právě tehdy, když P(A)(1-P(B)) = P(A)-P(A ∩ B), tedy

P(A)-P(A)P(B)=P(A)-P(A ∩ B), čili -P(A)P(B) = -P(A∩ B) a to je jedna z již uvedených podmínek pro nezávislost.

Tato podmínka pro nezávislost je rovnocenná dalším dvěma:

P(nonB) = P(nonB/A) a P(A ∩ nonB)=P(A)P(nonB).

Mohli bychom také vyměnit A za nonA a tak podobně. Celkem bychom dostali velký počet ekvivalentních podmínek. Ty mají hlavní smysl pro pochopení věci.


Základní vlastnosti a poznámky (nepovinné)

Zdálo by se, že když dvojice jevů A a B je nezávislá a dvojice B a C je nezávislá, že i dvojice A a C by snad měla být nezávislá. Je to jen špatný pohled na věc. Zkusme si představit nezávislou dvojici jevů A a B a nezávislou dvojici jevů B a C tak, že A a C jsou disjunktní, P(A)>0, P(A ∩ B)>0, P(B)>0, P(B ∩ C)>0 a P(C)>0, zatímco P(A ∩ C)=0. Z toho plyne P(A/C)=P(A∩C)/P(C)=0/P(C)=0, avšak P(A)>0 znamená závislost. Vhodný je diagram s P(A)=0,1; P(A ∩ B)=0,01; P(B)=0,1; P(B∩C)=0,01; P(C)=0,1; P(A∩C)=0.

Často se po prvním čtení pletou pojmy neslučitelný a nezávislý. Ukážeme si že neslučitelnost má za následek závislost a nezávislost má za následek to, že jevy nejsou neslučitelné.

Jestliže A a B jsou neslučitelné, P(A)>0 a P(B)>0, pak P(A) P(A/B) = P(A∩B)/P(B) = 0/P(B) = 0. To znamená, že jsou závislé.

Jestliže dvojice A a B je nezávislá, je 0<P(A)=P(A/B)=P(A ∩ B)/P(B), odtud P(A∩ B)>0 a množina

A ∩ B je neprázdná, čili A a B nejsou disjunktní.


Pravidlo o součinu v kombinatorice (nepovinné)

Pravidlo pro násobení je velmi důležité pro počítání s pravděpodobnostmi. Zjednodušují a zobecňují se výpočty, které by jinak byly velmi obtížné, a tím se otvírají další možnosti pro počet pravděpodobnosti.


Příklad: Předpokládejme, že budeme házet dvakrát ideální kostkou. Pravděpodobnost, že při jednom hodu padne šestka je 1/6. Jestliže dva hody jsou nezávislé, je pravděpodobnost padnutí dvou šestek rovna součinu 1/6 . 1/6=1/36. To jsme dokázali vypočítat, aniž bychom nutně museli vyjmenovat všechny dvojice, které mohou padnout. V tomto lehkém příkladě je jich 6 . 6 = 36 a klasická definice dá 1/36.

V kombinatorice zní pravidlo o násobení takto: Jestliže se jedna věc může stát M způsoby a druhá věc N způsoby nezávisle na tom, kterým z M způsobů se první věc stala, pak celkový počet, kolika způsoby se obě věci mohou stát, je dán součinem M . N. Toto pravidlo je možné aplikovat pro klasickou definici při opakování experimentů. Jestliže je při prvním experimentu M možných výsledků a při druhém experimentu N možných výsledků, pak při uvažování dvojice experimentů dohromady je M . N možných výsledků.


Analogicky, jestliže při prvním experimentu má MA z možných výsledků za následek jev A a při druhém experimentu má NB z možných výsledků druhého experimentu za následek jev B, nezávisle na tom, který z výsledků prvního experimentu nastal, pak je celkem MA . NB výsledků, které mají za následek to, že nastane jev A v prvním a zároveň jev B v druhém experimentu.

Navíc potřebujeme pro klasickou definici splnění toho, že všechny z možných M . N výsledků experimentů jsou stejně možné. Jestliže i toto je v modelu splněno, pak pravděpodobnost je definována jako


P = (MA . NB)/(M . N) = (MA/M) . (NB/N).


To znamená, že pravidlo o násobení je splněno a tudíž dvojice jevů A a B je nezávislá.

Tento výklad je možné si představit pomocí kartézského součinu. Prvky takového kartézského součinu jsou všechny uspořádané dvojice výsledků prvního a druhého experimentu. Těch je M . N. Těch dvojic, které odpovídají jevu A a zároveň B, je MA . NB. Musíme ještě zvážit předpoklad, že všechny dvojice jsou stejně možné. Pak můžeme použít klasickou definici a dostaneme nezávislost.


Nezávislost bývá zásadní požadavek pro budování matematického modelu. Nezávislost v matematickém modelu je někdy možné představit si pomocí nezávislosti v ideálním pomocném modelu. V reálném fyzikálním světě při opakování experimentů avšak je jen možné usilovat, abychom udělali vše pro to, aby jevy byly nezávislé. Nezávislost bývá přitom při opakování experimentů jedním z nejdůležitějších požadavků při budování pravděpodobnostního modelu a jeho ověřování.


Nezávislé klasifikace (nepovinné)

Seznam kategorií, které jsou neslučitelné a vyčerpávající se nazývá klasifikace. Budeme se snažit popsat, co znamenají dvě nezávislé klasifikace. Jako příklad si uvedeme barvu očí jako jednu z klasifikací a barvu vlasů jako druhou klasifikaci. Otázkou je, zda barva očí a barva vlasů jsou na sobě nezávislé.

Pro barvu očí zavedeme kategorie modrá, zelená, hnědá a ostatní. Pravděpodobnosti, že osoba z nějaké populace je v těchto kategoriích označme po řadě Pm, Pz, Ph, Po a platí Pm+Pz+Ph+Po=1. Pro barvu vlasů zaveďme kategorie světlé, hnědé, tmavé. Jejich pravděpodobnosti po řadě označíme Qs, Qh a Qt, a platí Qs+Qh+Qt=1. ?


Jestliže barva očí a barva vlasů na sobě nezávisí, pak každá dvojice kategorií barvy očí a barvy vlasů je nezávislá. Pak pravděpodobnost jejich současného výskytu se vypočítá jako součin příslušných pravděpodobností. Například to, že osoba z populace má modrou barvu očí a zároveň hnědé vlasy má mít pravděpodobnost PmQh. Hypotéza o nezávislosti se pak dá vyjádřit pomocí matice

PmQs , PzQs , PhQs , PoQs

PmQh , PzQh , PhQh , PoQh

PmQt , PzQt , PhQt , PoQt


Součet pravděpodobností v prvním řádku je PmQs + PzQs + PhQs + PoQs = (Pm+Pz+Ph+Po)Qs = Qs. Podobně součet druhého řádku je Qh a součet třetího řádku vyjde Qt. Součet všech prvků matice je možné napsat jako součet součtů řádků Qs+Qh+Qt=1. Takový výsledek by nás neměl překvapit. Je to jen ověření toho, že musí vždycky platit, že součet pravděpodobností na prvním řádku dá Qs a podobně pro ostatní řádky.


Je zřejmé, že prvky matice jsou pravděpodobnosti, protože vyhovují axiomatické definici. Tím jsme běžný pojem nezávislosti převedli na pravděpodobnostní model. Nezávislost si můžeme ověřit i tak, že předpokládáme splnění nějaké podmínky pro barvu očí, třeba oči modré, a dostaneme podmíněné pravděpodobnosti (PmQs)/Pm=Qs, (PmQh)/Pm=Qh a (PmQt)/Pm=Qt. I při jiné barvě očí dostaneme vždy stejné pravděpodobnosti pro barvu vlasů, to znamená, že jsou nezávislé na barvě očí.