Spravodlivá hra

Janko tipér zistil pri svojom “tipovaní” zaujímavú vec:

Ak hodí mincou trikrát, tak postupnosť PPP (panna, panna, panna) je rovnako častá ako POO (panna, orol, orol) a tá je rovnako častá ako POP (panna, orol, panna).
Teraz sa tvári múdro a tvrdí, že pri troch hodoch je každá z ôsmich postupností – OOO, OOP, OPO, OPP, POO, POP, PPO, PPP rovnako pravdepodobná.

Niektorým jeho kamarátom sa to moc nezdá a tak sa to Janko rozhodne dokázať. Ako ináč, pomocou stávky. A ako ináč, Marián stávku prijme bez toho aby vedel aká bude.
Janko povedal, že si náhodne vyberie niektorú z ôsmich možností, povie ju Mariánovi, ten si zo zostávajúcich siedmich sekvencií vyberie tú, ktorá sa mu najviac páči.
Potom budú hádzať mincou a čia sekvencia sa vyskytne prvá, ten vyhráva. Aby to bolo čo najspravodlivejšie, zahrajú si takto sto hier. Každú o 1€.

Príklad:
Ak by si Janko vybral OOO a Marián OOP, hra by mohla prebiehať nasledovne:
1. hra OPPPOOP – 1€ vyhráva Marián
2. hra POPOPOOO – 1€ vyhráva Janko
3. hra OPOPOPOPOPOPOPOPPPPPPPPPOOP – 1€ vyhráva Marián
4. hra OOO – 1€ vyhráva Janko
atď.

Janko teda tvrdí, že keď si on svoju postupnosť vyberie náhodne a Marián si na základe Jankovej postupnosti vyberie akúkoľvek postupnosť, tak po sto hrách budú obaja približne na nule.
Má Janko pravdu?

Janko tiež tvrdí, že mu je jedno, ktorú možnosť si vyberie. Preto umožní Mariánovi, aby mu ju vybral on.
Ako to zmení výsledok?

Riešenie

Ako prvé si je nutné uvedomiť, že aj keď sú trojice rovnako pravdepodobné, tak stávka znie inak – v ktorom hode sa želaná trojica vyskytne prvýkrát? V príkladoch sa víťazná trojica vyskytla v 5. (6., 25., 1.) hode – ak počítame prvý hod z trojice.

Asi je jasné, že vytúžená trojica sa môže prvýkrát vyskytnúť v prvom ťahu, alebo druhom, treťom … Preto môžeme vypočítať priemerný hod, v ktorom sa daná trojica vyskytne prvýkrát. Idea je, že ak by sa napríklad jedna trojica v priemere prvýkrát vyskytovala v 12. hode a druhá v 6. hode, tak tá druhá bude vyhrávať častejšie (v priemere bude skôr). To sa zdá byť úplne jasné.

Ak by hralo OOP proti OOO, skončí to remízou. Obaja hráči musia najskôr hodiť OO a potom má každý 50% šancu.

Ak by hralo POO proti OOO, skončí to výhrou pre POO. Dôvod je jednoduchý, pri OOO treba hodiť 3x za sebou O. Ak v ľubovoľnom hode padne P, tak sa musí hádzať ešte 3x a nevyužije sa to, čo bolo hodené doteraz (prípadná výhra môže začať až od nasledujúceho hodu). Pri POO, ak namiesto ktoréhokoľvek O padne P, tak sa toto P počíta ako možný začiatok trojice a možno bude stačiť hádzať iba 2x, využijúc aj tento hod (prípadná výhra môže začínať už v tomto ťahu).

Čuduj sa svete, spomínané OOP aj POO nastanú v priemere na 6. hod, OOO v priemere na 12. hod. Vždy je to 12 proti 6, ale výsledok je rozdielny. 🙁


V tomto príklade priemernú hodnotu prvého výskytu trojice nie je treba, ale v mnohých príkladoch sa túto metódu oplatí vedieť, navyše je to naozaj zaujímavý postup, takže:

Pre priemerný počet hodov \(p\) na dosiahnutie prvej trojice OOO treba zostaviť rovnicu:

\(p=\frac{1}{8}\cdot 1+ \frac{1}{2}(p+1)+\frac{1}{4}(p+2)+\frac{1}{8}(p+3)\)

Prvý člen je pravdepodobnosť, že padne OOO (t.j. \(\frac{1}{8}\)) krát prvý hod. Druhý člen popisuje stav, keď padne P namiesto prvého O (pravdepodobnosť \(\frac{1}{2}\)). Treba začať hádzať odznova, stratili sme jeden hod, preto k \(p\) pripočítame \(1\). Tretí člen popisuje stav, keď sa hodí OP (pravdepodobnosť \(\frac{1}{4}\)). Treba začať hádzať odznova, stratili sme dva hody, preto k \(p\) pripočítame \(2\). Podobne posledný člen.

\(p=12\)

Pre priemerný počet hodov \(q\) na dosiahnutie prvej trojice POO treba zostaviť rovnicu (o niečo ťažšia než pre OOO):

\(q=\frac{1}{8} + \frac{q+1}{2}+\frac{r+1}{4}+\frac{r+2}{8}\)

Prvý a druhý člen má rovnaký význam ako vyššie. Posledné dva sú podobné. Všimnite si, že k \(r\) pripočítavame nie \(2\) a \(3\) ale \(1\) a \(2\), pretože sa využije hodené P (v tomto prípade naozaj platí, že všetko zlé je na niečo dobré), \(r\) je priemerný počet hodov na dosiahnutie prvej dvojice OO.

\(r=\frac{1}{4}+\frac{r+1}{2}+\frac{r+2}{4}\)

\(r=5\) a z toho \(q=6\)

Podobne možno vypočítať, že priemer prvých výskytov OOP (takisto aj PPO) je tiež \(6\).


Treba si uvedomiť, že to čo sme používali a vypočítali je priemerná hodnota hodu, v ktorom sa prvýkrát vyskytne daná trojica. Nie je to priemerná hodnota víťazného hodu trojice – to by sme museli vylúčiť, že pred týmto hodom nepadla trojica protihráča.

Teraz je to úplne jasné, nová idea. Potrebujeme  porovnať priemerné hodnoty víťazných hodov Takže príklad:

Nech trojica X vyhráva v priemere \(5,\overline{66}\). hodom. Trojica Y nech vyhráva v priemere \(11\). hodom. Znamená to, že X bude vyhrávať častejšie ako Y?

A čo ak trojica Y vyhráva vždy prvým hodom (priemer je \(1\))?

Faktom je, že POO víťazí v priemere v \(5,\overline{66}\). hode a OOO prekvapujúco víťazí iba na začiatku! A už vieme, že POO by malo vyhrať nad OOO. Takže ani priemerný víťazný hod nepomôže. 🙁 🙁

Prečo OOO víťazí iba prvým hodom? Akonáhle padne P, už nemôžu padnúť OOO, pretože pri OO dostaneme víťazné POO. To vedie k jednoduchej úvahe: OOO vyhráva v \(\frac{1}{8}\) prípadov a POO vo zvyšku, teda v \(\frac{7}{8}\) prípadov.


Priemernú hodnotu víťazného hodu trojice POO \(vq\) vypočítame (v tomto prípade zbytočne) veľmi podobne ako vyššie:

\(vq=\frac{1}{8} + \frac{vq+\frac{2}{3}}{2}+\frac{r+1}{4}+\frac{r+2}{8}\), namiesto \(1\) pripočítavame v druhom člene \(\frac{2}{3}\), pretože \(0\)  môže padnúť len dvakrát, potom musí padnúť \(1\), teda v dvoch tretinách hodoch.

\(vq=\frac{17}{3}=5,\overline{66}\)


Odpoveď: Janko by pôvodnú stávku skôr prehral ako remizoval. A ak by Marián vybral OOO vs POO, tak by Marián vyhrával 7x častejšie a pri sto hrách by vyhral priemerne 75 € \(\left(=\frac{100}{7+1}\cdot(7-1)\right)\).