Výklad - diskrétní náhodná veličina: Binomické (Bernoulliovo) rozdělení

Binomické (Bernoulliovo) rozdělení

Alternativní rozdělení

Jestliže náhodná veličina může nabývat jen hodnot 0 a 1 s pravděpodobnostmi q a p nazývá se takové rozdělení alternativní. Musí platit q = 1 - p.

Uvedeme tabulku:

hodnota pravděpodobnost

0 q

1 p

Protože se někdy ta čísla pletou, říká se, že číslo 1 je úspěch a číslo 0 je neúspěch.

Alternativní rozdělení tedy reprezentuje výsledek jednoho pokusu.

Pojem alternativní náhodné veličiny je jednoduchý a má mnoho použití. Hodí se nejen k modelování ordinálních dat, ale i nominálních, pokud se uvažují jen dvě kategorie, neboli ta druhá je doplňkem k první. Nehovoříme o kategorii prázdné a jisté.

Jen pro zajímavost se zmíníme o tom, že alternativní rozdělení se používá jako tak zvaná indikátorová funkce. Když v počtu pravděpodobnosti přiřadíme nějakému jevu A číslo jedna, čili jej prohlásíme za úspěch, použijeme pravděpodobnost P(A) tohoto jevu pro definici alternativního rozdělení. Když nastane jev A, je to označeno za úspěch, náhodná veličina nabývá hodnoty 1. Doplňku tohoto jevu se říká neúspěch - náhodná veličina nabývá hodnoty 0.

Obecně se pojem indikátorová funkce používá v teorii množin tak, že tato funkce zobrazuje prvky x množiny S na množinu skládající se jen ze dvou prvků 0 a 1. Pro podmnožinu A množiny S, indikátorová funkce I_A(a) nabývá hodnoty 1, jestliže x je prvkem A a hodnoty 0, jestliže x není prvkem A. Tato konstrukce se může zdát umělou, ale plně vystihuje použití alternativního rozdělení.

Binomické rozdělení

Graf binonického rozdělení pro N=10 a různé hodnoty p a q

Binomické rozdělení

Předpokládejme, že pravděpodobnost úspěchu v jednom experimentu je p a pravděpodobnost neúspěchu je q = 1 - p. Představme si, že provedeme nezávisle N experimentů. Při nich nám vyjde K úspěchů. Počet úspěchů K můžeme chápat jako náhodnou veličinu X, která může nabývat hodnot celočíselných od nuly maximálně do N.

Musíme pouze odvodit pravděpodobnosti. K tomu je podstatná podmínka nezávislosti. Zatím umíme odvodit pravděpodobnost P(X=N) toho, že při N experimentech nastane N úspěchů. Vyjdeme z nezávislosti a použijeme pravidlo o násobení, takže P(X=N) = p^N.

Podobně umíme říci, že P(X=0) = q^N. Zbývá jen odvodit obecný vzorec pro libovolné K. Když se řekne libovolné, je jasné, že pro K>N a pro K<0 je pravděpodobnost nulová.

Začneme případem N=2. Zkratka NeNe znamená, že nastaly dva neúspěchy, NeUs označuje neúspěch a úspěch a tak dále. Díky nezávislosti můžeme pravděpodobnosti násobit, takže například pravděpodobnost neúspěchu následovaného úspěchem můžeme zapsat jako qp. Celý seznam možných výsledků dvou pokusů je i s jejich pravděpodobnostmi v následující tabulce.

NeNe qq

NeUs qp

UsNe pq

UsUs pp

Odtud vypočteme, že P(X=0) = q², P(X=1) = qp + pq = 2pq, P(X=2) = p². Je dobré si uvědomit, že u binomického rozdělení záleží jen na počtu úspěchů, nikoliv na pořadí, ve kterém se úspěchy a neúspěchy vyskytnou.

Mnohočlen, čili polynom, skládající se jen ze dvou členů, například p+q se nazývá binom. Známe vzorec (p + q)² = p² + 2pq + q², u kterého si můžeme zkontrolovat, že dává jako sčítance pravděpodobnosti binomického rozdělení pro N=2.

Zkusíme si projít ještě všechny případy pro N=3. Dostaneme

NeNeNe qqq

UsNeNe pqq

NeUsNe qpq

NeNeUs qqp

UsUsNe ppq

UsNeUs pqp

NeUsUs qpp

UsUsUs ppp

Jelikož na pořadí nezáleží, neboť nás zajímá jen počet úspěchů, je P(X=0) = q³, P(X=1) = 3pq², P(X=2) = 3p²q, P(X=3) = p³.

Tento přístup je možné zobecnit pro libovolný počet pokusů N. Výskyt úspěchů a neúspěchů při N pokusech je možné si představit jako N pozic, na které umístíme K krát symbol Ne. Nezáleží při tom na pořadí. Toto je ale známá otázka z kombinatoriky, kdy se ptáme, kolika způsoby můžeme vybrat K prvků z N prvků, když se prvky mohou opakovat. Počet způsobů je dán binomickým koeficientem

$\left( {_K^N}\right)$

Všimněme si, že název opět pochází z použití tohoto koeficientu pro binomy. Jestliže si někdo nepamatuje odvození, je možné tento koeficient chápat jen jako označení počtu způsobů výběru K pozic z N pozic.

$P(X=K)=\left({_K^N}\right)p^Kq^{N-K}$

Je jistě výhoda mít místo tabulek k dispozici jednoduchý vzoreček k počítání pravděpodobností. Pro úplnost je nutné dodat, že P(X=K) je nulová pro záporná K a pro K>N.

Poznámky k diskrétním náhodným veličinám

Jestliže pravděpodobnost úspěchu p i pravděpodobnost neúspěchu q je stejná, neboli p = q, a přitom q = 1 - p, tedy p = 1 - p, 2p = 1, potom musí platit p = 1/2. Tento model se často používá. Pro házení korunou, ale též když chceme říci, že zlepšení i zhoršení (nebo zvýšení či snížení) může nastat se stejnou pravděpodobností.