Spravodlivá hra 2

Táto úloha je voľným pokračovaním úlohy Spravodlivá hra.

Janko a Marián hrajú na námestí nasledujúcu hru: Janko hádže mincou. Za každý hod zaplatí Mariánovi 1€. Ale keď hodí za sebou PO (panna, orol), tak mu Marián vyplatí 5€ a potom hrajú znova.

Príklad:
1. hra OPPPO – remíza.
2. hra PO – 3€ vyhráva Janko
3. hra OPO – 2€ vyhráva Janko
4. hra OOOPPO – 1€ vyhráva Marián
atď.

Maroško to už nejaký čas sleduje a zdá sa mu, že Janko vyhráva. Aj on chce zarobiť, tak navrhne Mariánovi, že si to zahrá namiesto Janka. Marián súhlasí, ale že na výhru musí Maroško hodiť nie PO ale OO.

Má Maroško pravdu, že pôvodná hra je výhodná pre hráča, ktorý platí za hod?
Ako zmení výsledok zmena výhernej postupnosti na OO?

Riešenie

Ako prvé si je nutné uvedomiť, že aj keď sú dvojice PO a OO rovnako pravdepodobné, tak v stávke ide o iné – v ktorom hode sa želaná dvojica vyskytne prvýkrát? V príkladoch sa víťazná dvojica vyskytla v 5. (2., 3., 6.) hode – ak počítame druhý hod z dvojice.

Asi je jasné, že vytúžená dvojica sa môže prvýkrát vyskytnúť v druhom ťahu, treťom … Preto môžeme vypočítať priemerný hod, v ktorom sa daná dvojica vyskytne prvýkrát. Tento priemerný hod (počet zaplatených € za hody) potom porovnáme s vyplácanou výhrou (5€).

Už by malo byť zrejmé (z Spravodlivá hra), že PO je výhodnejšie ako OO. Dôvod je jednoduchý, pri OO treba hodiť 2x za sebou O. Ak v ľubovoľnom hode padne P, tak sa musí hádzať ešte 2x a nevyužije sa to, čo bolo hodené doteraz (prípadná výhra môže začať až od nasledujúceho hodu). Pri PO, ak namiesto ktoréhokoľvek O padne P, tak sa toto P počíta ako možný začiatok dvojice a možno bude stačiť hádzať iba 1x, využijúc aj tento hod (prípadná výhra môže začínať už v tomto ťahu).


Pre priemerný počet hodov \(p\) na dosiahnutie OO treba zostaviť rovnicu:

\(p=\frac{1}{4}\cdot 2+ \frac{1}{2}(p+1)+\frac{1}{4}(p+2)\)

Prvý člen je pravdepodobnosť, že padne OO (t.j. \(\frac{1}{4}\)) krát dva hody. Druhý člen popisuje stav, keď padne P namiesto prvého O (pravdepodobnosť \(\frac{1}{2}\)). Treba začať hádzať odznova, stratili sme jeden hod, preto k \(p\) pripočítame \(1\). Tretí člen popisuje stav, keď sa hodí OP (pravdepodobnosť \(\frac{1}{4}\)). Treba začať hádzať odznova, stratili sme dva hody, preto k \(p\) pripočítame \(2\).

\(p=6\)

Preto podľa nových pravidiel Maroško prehrá v priemere 1€ na hru.

Ak by sme počítali prvý hod dvojice (tak ako v prvej úlohe), tak by sa rovnica zmenila:

\(p=\frac{1}{4}\cdot \mathbf{1} + \frac{1}{2}(p+1)+\frac{1}{4}(p+2)\)

\(p=5\) a museli by sme pripočítať 1€ za druhý hod víťaznej kombinácie.


Pre priemerný počet hodov \(q\) na dosiahnutie PO treba zostaviť rovnicu (o niečo ťažšia než pre OO):

\(q=\frac{1}{4}\cdot 2+ \frac{1}{2}(q+1)+\frac{1}{4}(r+2)\)

Prvý člen je pravdepodobnosť, že padne PO (t.j. \(\frac{1}{4}\)) krát dva hody. Druhý člen popisuje stav, keď padne O namiesto prvého P (pravdepodobnosť \(\frac{1}{2}\)). Treba začať hádzať odznova, stratili sme jeden hod, preto k \(q\) pripočítame \(1\). Tretí člen popisuje stav, keď sa hodí PP (stratené 2 hody, pravdepodobnosť \(\frac{1}{4}\)). Stačí hodiť O, preto \(r\) je priemerný počet hodov na dosiahnutie O.

\(r=\frac{1}{2}\cdot 1+\frac{1}{2} \cdot (r+1)\)

\(r=2\) a z toho \(q=4\)

Preto podľa starých pravidiel Janko zarábal v priemere 1€ na hru.

Ak by sme počítali prvý hod dvojice (tak ako v prvej úlohe), tak by sa rovnica zmenila:

\(p=\frac{1}{4}\cdot \mathbf{1} + \frac{1}{2}(p+1)+\frac{1}{4}(r+\mathbf{1})\), výpočet \(r\) sa nemení.

\(p=3\) a museli by sme pripočítať 1€ za druhý hod víťaznej kombinácie.


Pre niekoho/niekedy môže byť výhodnejšie rozmýšľať inakšie. Chceme hodiť OO. Nech \(p\) – priemerný počet hodov na dosiahnutie OO. Hodíme jedenkrát mincou:

  1. Na 50% padne P a nastane rovnaká situácia ako pred hodom (\(p\)) – treba hodiť OO.
  2. Na 50% padne O, tak treba hodiť ďalším hodom O. Nech \(p_o\) – priemerný počet hodov na dosiahnutie OO ak predchádzajúcim hodom bolo hodené O.
    Hodíme opäť jedenkrát mincou:
    Ak teraz padne O = výhra, koniec – žiadne ďalšie hody.
    Na 50% padne P, nastane situácia ako úplne na začiatku = je nutné hodiť OO, t. j. (\(p\)).

To môžeme zapísať rovnicami:
\(p=1+ \frac{1}{2}\cdot p+\frac{1}{2} \cdot p_o\)
\(p_o=1 + \frac{1}{2} \cdot p\)

Výsledok je rovnaký ako vyššie.


Chceme hodiť PO. Nech \(q\) – priemerný počet hodov na dosiahnutie PO. Hodíme jedenkrát mincou:

  1. Na 50% padne O a nastane rovnaká situácia ako pred hodom (\(q\)) – treba hodiť PO.
  2. Na 50% padne P, tak treba hodiť ďalším hodom O. Nech \(q_p\) – priemerný počet hodov na dosiahnutie PO ak predchádzajúcim hodom bolo hodené P.
    Hodíme opäť jedenkrát mincou:
    Ak teraz padne O = výhra, koniec – žiadne ďalšie hody.
    Na 50% padne P, nastane situácia ako pred hodom = stačí hodiť O, t. j. (\(q_p\)).

To môžeme zapísať rovnicami:
\(q=1+ \frac{1}{2}\cdot q+\frac{1}{2} \cdot q_p\)
\(q_p=1 + \frac{1}{2} \cdot q_p\)

Výsledok je rovnaký ako vyššie.