Danko a Jarko hádžu striedavo kockou. Dohodli sa na nasledovnom pravidle:
- Kto hodí prvý šestku vyhráva od druhého 1€. Hrajú 132 hier. Danko vždy začína. Koľko je jeho predpokladaná výhra?
- Aký je priemerný počet hodov, ktoré Danko (Jarko) potrebuje na výhru.
Jarkovi sa to pravidlo z nejakého dôvodu nepáčilo a navrhol zmenu:
- To isté ako v pôvodnom pravidle, ale Jarko pri svojom prvom hode v každej hre vyhráva aj keď hodí päťku. Koľko je jeho predpokladaná výhra?
- Aký je priemerný počet hodov, ktoré Danko (Jarko) potrebuje na výhru.
Riešenie
Pôvodné pravidlo:
Označme pravdepodobnosť ich výhry \(P_d\) a \(P_j\). Keďže niekto vyhrať musí (skôr, či neskôr), tak \(P_d +P_j=1\)
Danko vyhrá ak hodí šestku (to je pravdepodobnosť \(\frac{1}{6}\)) a ak nevyhrá prvým hodom, tak sa dostane do pozície v akej bol Jarko:
\(P_d =\frac{1}{6}+\frac{5}{6} P_j\)
Alebo inak, Jarko má \(\frac{5}{6}\) pravdepodobnosť, že bude v rovnakej pozícii ako Danko
\(P_j =\frac{5}{6} P_d\)
Z čoho dostaneme: \(P_d=\frac{6}{11}\), \(P_j=\frac{5}{11}\). Po 132 hrách by mal byť Danko bohatší o 12€.
Hodiť šestku trvá (každému) v priemere 6 hodov:
\(poc6=\frac{1}{6}\cdot 1+ \frac{5}{6}(1+poc6)\), \(poc6=6\)
To platí pre normálne hádzanie. Ak berieme iba víťazné hody, tak môžeme očakávať, že to bude menej.
Priemerný počet víťazných hodov, ak vyhrá Danko:
\[\sum _{i=1}^{\infty } (i) \frac{1}{6} \left(\frac{25}{36}\right)^{i-1}\bigg/\frac{6}{11}=\frac{216}{121}\cdot\frac{11}{6}=\frac{36}{11}\doteq3,273\]
Priemerný počet víťazných hodov sme vypočítali ako \(\sum _{i=1}^{\infty } i \cdot P(i)\), t. j. ako súčet súčinov poradového čísla hodu s pravdepodobnosťou výhry v tom hode. Použili sme všetky poradové čísla od jedna po nekonečno.
\(\left(\frac{25}{36}\right)^i\) je pravdepodobnosť, že šestka nepadne v \(i\) hodoch. Danko nehodí šestku v jednom hode s pravdepodobnosťou \(\frac{5}{6}\), rovnako \(\frac{5}{6}\) je pravdepodobnosť, že ju v jednom hode nehodí Jarko.
Ak by sme nedelili celkovou pravdepodobnosťou Dankovej výhry \(\left(\frac{6}{11}\right)\) dostali by sme „priemerný“ počet hodov zo všetkých hier, ale my chceme iba tie hry, ktoré Danko vyhral.
Priemerný počet víťazných hodov, ak vyhrá Jarko:
\[\sum _{i=1}^{\infty } (i) \frac{1}{6} \frac{5}{6} \left(\frac{25}{36}\right)^{i-1}\bigg/\frac{5}{11}=\frac{180}{121}\cdot\frac{11}{5}=\frac{36}{11}\doteq3,273\]
Je to to isté, len v pravdepodobnosti pribudlo \(\frac{5}{6}\), pretože Jarko môže hádzať iba ak Danko prvýkrát nehodí. A delíme celkovou pravdepodobnosťou Jarkovej výhry.
Iné riešenie pre oboch naraz:
\[\sum _{i=1}^{\infty } i \left(\left(\frac{25}{36}\right)^{i-1}-\left(\frac{25}{36}\right)^i\right)=\frac{36}{11}\doteq3,273\]
Pravdepodobnosť výhry v \(i\)-tom hode (inak povedané, že bude prvýkrát hodená šestka):
\(P(i)=\left(1-\left(\frac{25}{36}\right)^i\right)-\left(1-\left(\frac{25}{36}\right)^{i-1}\right)=\left(\frac{25}{36}\right)^{i-1}-\left(\frac{25}{36}\right)^i\)
\(1-\left(\frac{25}{36}\right)^i\) je pravdepodobnosť, že šestka padne do \(i\)-tého hodu.
Jarkove pravidlo
Opäť máme \(P_d +P_j=1\). Jarko vyhrá s pravdepodobnosťou:
\(P_j= \frac{5}{6}(P_d+\frac{1}{6})\), Danko mohol vyhrať v prvom hode s pravdepodobnosťou \(\frac{1}{6}\), preto ostáva \(\frac{5}{6}\) a zrazu je situácia rovnaká ako pri Dankovi ale jedenkrát možno hodiť aj päťku, čo je \(\frac{1}{6}\) navyše.
Alebo inak
\(P_d=\frac{1}{6}+\frac{5}{6} \left(P_j-\frac{1}{6}\right)\)
\(P_d=\frac{31}{66}\), \(P_j=\frac{35}{66}\)
Po 132 hrách by mal byť Jarko bohatší o 8€.
Hodiť 5 prvým hodom alebo 6 kedykoľvek trvá v priemere 5 hodov.
\(poc56=\frac{2}{6}\cdot 1+ \frac{4}{6}(1+poc6)\), \(poc56=5\)
To platí pre normálne hádzanie. Ak berieme iba víťazné hody, tak môžeme očakávať, že to bude menej. Teraz ale budú mať Danko a Jarko rôzne hodnoty.
Priemerný počet víťazných hodov, ak vyhrá Danko:
\[\left(\frac{1}{6} \cdot 1 + \sum_{i=2}^{\infty} i \cdot \frac{1}{6}\cdot \frac{4}{6}\cdot\frac{5}{6}\cdot \left(\frac{25}{36}\right)^{i – 2}\right)\bigg/\frac{31}{66}=\frac{197}{77}\doteq 3,111\]
Priemerný počet víťazných hodov, ak vyhrá Jarko:
\[\left(\frac{5}{6} \cdot \frac{2}{6} \cdot 1 + \sum_{i=2}^{\infty} i \cdot \frac{1}{6}\cdot \frac{4}{6}\cdot \left(\frac{25}{36}\right)^{i – 1} \right) \bigg/ \frac{35}{66}=\frac{1061}{341}\doteq 2,558\]
Pretože je nepravidelnosť v určovaní výhry v prvom ťahu, tak je prvý ťah vyhodnotený zvlášť a suma začína až od druhého ťahu.