Statistické paradoxy, neintuitivní řešení a zajímavé úlohy
1. Monty Hallův problém
Tohle je klasika, kterou musíme začít. Internet je plný úplného popisu, my si to zjednodušíme.
Zadání:
Máme troje zavřené dveře, za jedněma je poklad, který chcete vyhrát. Ukážete na dveře, kde myslíte, že je schován. Potom já ze zbývajících dvou dveří otevřu jedny, kde poklad není.
Trváte na původně ukázaných dveřích nebo budete chtít změnit svoje rozhodnutí a otevřít ty zbývající dveře?
Intuice:
Jedny dveře jsou otevřené, já vybírám mezi dvěma, šance je půl na půl, je jedno, jestli svoje rozhodnutí změním nebo ne.
Skutečnost:
Rozhodnutí byste měli změnit - ty druhé dveře mají dvojnásobnou pravděpodobnost výhry!
Vysvětlení:
Že jsem napoprvé trefil poklad (jedny dveře ze tří), je pravděpodobnost 1/3, o tom není pochyb.
Pravděpodobnost pokladu ve zbylých dvou dveřích je 2/3, to je taky zřejmé.
Pokud jedny dveře otevřu, pravděpodobnost vůbec neovlivním. Takže zbývající poslední zavřené dveře mají pravděpodobnost pokladu stále 2/3.
Zbývající dveře tak mají skutečně dvojnásobnou pravděpodobnost výhry než původně vybrané.
Intuitivní alternativa:
Máme deset dveří, za jedněma je poklad. Jedny vyberete, já otevřu osm bez pokladu. Změníte rozhodnutí a vyberete ty jedny zbylé neotevřené dveře?
2. Narozeniny na hřišti
Zadání:
Uvažujme fotbalový zápas, kde jsou na hřišti dva týmy a jeden rozhodčí. Celkem tedy 23 osob.
Jak je velká pravděpodobnost, že některá dvojice bude mít narozeniny ve stejný den?
Zkuste si to tipnout.
Intuice:
Celkem je 365 dní, osob je 23. Počet osob je tak nízký, že pravděpodobnost narozenin ve stejný den bude hodně malá, určitě pod 10 %.
Jiný přístup:
Těch 23 osob vlastně znamená 253 různých dvojic. Potom by se pravděpodobnost třeba dala tipovat na 70 %.
Skutečnost:
P je pravděpodobnost, že někdo z 23 lidí má narozeniny ve stejný den.
Dolpněk p: každý z "k" lidí má narozeniny jindy.
První může mít narozeniny jakýkoliv den z 365, druhý už jen 364 z 365, třetí 363 z 365, atd.:
p(k) = 365/365 * 364/365 * 363/365 * (365-k+1)/365
p(23) = 0,493
P(23) = 1 - p(23) = 0,507
Pravděpodobnost, že některá dvojice má narozeniny ve stejný den je 50,7 %.
3. Narozeniny ve stejný den jako já
Zadání:
Kolik musí být přítomno pohromadě lidí, aby pravděpodobnost, že někdo z přítomných má narozeniny ve stejný den jako vy, byla větší než 1/2?
Zkuste si opět tipnout, pomůže inspirace předchozím příkladem?
Řešení:
Doplněk - pravděpodobnost, že žádná osoba nemá narozeniny jako já:
364/365 * 364/365 * 364/365 * k-krát
Klesá to velice pomalu, až při k=253 je součin menší než 1/2.
(364/365)^253 = 0,4995
Potřebujeme 253 lidí.
4. Basketbal
A jeden oddychový příklad:
Zadání:
Představte si, že jste na basketbalovém hřišti a někdo vám nabídne sázku, zda trefíte trestný hod neboli takzvanou šestku.
Jaká je pro vás výhodnější sázka? Vsadit se, zda trefíte jeden hod, anebo dva ze tří?
Řešení:
Hráč trefuje šestky s pravděpodobností P procent. Když háže jednu, má pravě pravděpodobnost těchto P procent. Když háže třikrát a má dát aspoň dvě, připadají v úvahu čtyři (pozitivní) možnosti:
Buď trefí všechny tři šestky, nebo dá jen první a druhou, nebo dá jen první a třetí, anebo dá jen druhou a třetí. Pravděpodobnost, že dá všechny tři, je P*P*P.
Pravděpodobnost, že dá dvě a jednu nedá, je (P*P*(1 - P)), a to je nutné znásobit třikrát, protože tyto možnosti jsou tři.
Celková pravděpodobnost úspěchu = P*P*P + 3*(P*P*(1 - P)).
Zajímavé je, když se pokusíme dosazovat konkrétní čísla. Řekněme, že jde střílet nějaký špičkový hráč s úspěšností střelby 80 %. Pak pravděpodobnost, že dá dvě ze tří, vychází na 89,6 %.
Tedy je pro něj lepší, aby střílel dvě ze tří a ne jen jednu. Ale platí to obecně?
Zkusme druhý příklad - někoho s úspěšností velmi mizernou, řekněme 20 %. Pak pravděpodobnost, že dá dvě ze tří, je 10,4 %! Tedy je pro něj lepší házet jen jednou.
Pouze při úspěšnosti přesně 50 procent je to úplně jedno. Ono je to ovšem celkem logické, a vyplývá to i z obyčejné úvahy.
Když někdo skvěle střílí, je lepší, když má víc pokusů, protože tím eliminuje to, že bude mít jeden smolný hod a prohraje vše.
Ale když někdo střílí opravdu špatně, je pro nej lepší jedne pokus - třeba to náhodou trefí.
5. Rozklad 500 na prvočísla
Zadání:
Kolika různými způsoby je možné zapsat číslo 500 ve tvaru součtu šesti prvočísel?
Zkuste si tipnout.
Poradím, že existuje 95 prvočísel menších než 500.
Moje intuice:
Když jich má být právě 6, dají se taková prvočísla vůbec najít? Vzhledem k tomu, že to půjde nějak dorovnat těmi menšími, např. 2,3,5,7, tak těch způsobů bude asi víc, tipoval bych, že budou existovat desítky rozkladů.
Výsledek:
Pochybuju, že by se někdo dokázal přiblížit ke správnému počtu rozkladů: 76495. Kdyby někdo nevěřil, můžu poslat všechny možnosti...
6. Simpsonův paradox
Tohle je opět klasický příklad absolutní neintuitivnosti. Mnozí politikové toho velice zneužívají.
S problémem jsem se poprvé setkal v knížce "Simpsonovi a jejich matematická tajemství" (doporučuji). Nedávno mě tento paradox zaujal v IQ-Landii v Liberci (doporučuji).
Statistika:
Máme dvě nemocnice X a Y. Peníze dáme nemocnici, která má lepší úspěšnost léčby.
Soubor pacientů rozdělíme na těžce nemocné a lehce nemocné a úspěšnost budeme hodnotit v rámci těchto skupin, aby to bylo spravedlivější.
Těžce nemocní pacienti:
Nemocnice X vyléčila 30 pacientů ze 100 (úspěšnost 30 %).
Nemocnice Y vyléčila 210 pacientů ze 400 (úspěšnost 52,5%).
Lehce nemocní pacienti:
Nemocnice X vyléčila 870 pacientů ze 900 (úspěšnost 96,7 %).
Nemocnice Y vyléčila 590 pacientů ze 600 (úspěšnost 98,3 %).
V obou případech má nemocnice Y větší úspěšnost, takže není co řešit, peníze posíláme do Y.
Paradox:
Jenomže není všechno takové, jak se na první pohled zdá. Počty pacientů jsme zvolili tak, aby se v každé nemocnici léčilo dohromady 1000 pacientů.
Nemocnice X vyléčila dohromady 900 pacientů (úspěšnost 90 %).
Nemocnice Y vyléčila dohromady 800 pacientů (úspěšnost 80 %).
Stále trváme na tom, že peníze pošleme nemocnici Y?
7. Simpsonův paradox z druhé strany
Použijeme stejná čísla, jenom jiné entity. Budeme mít dvě zbraně: ubohou a skvělou.
Budeme střílet do dvou terčů: jeden bude hodně blízko, druhý hodně daleko. Z každé zbraně se celkem vystřelí 1000x.
Celkové statistiky:
Ubohá zbraň měla celkem 900 zásahů (úspěšnost 90 %).
Skvělá zbraň měla celkem 800 zásahů (úspěšnost 80 %).
Jak je to možné? (Ještě dodejme, že z obou zbraní střílel jeden střelec.)
Dílčí statistiky:
Podívejme se na to, jak byly zbraně úspěšné při střelbě na jednotlivé terče.
Blízký terč:
Ubohá zbraň měla 870 zásahů ze 900 (úspěšnost 96,7 %).
Skvělá zbraň měla 590 zásahů ze 600 (úspěšnost 98,3 %).
Vzdálený terč:
Ubohá zbraň měla 30 zásahů ze 100 (úspěšnost 30 %).
Skvělá zbraň měla 210 zásahů ze 400 (úspěšnost 52,5%).
Skvělá zbraň má podle očekávání větší úspěšnost při střelbě na bližší i vzdálenější terč.
Vysvětlení:
Skvělá zbraň střílela 4x více na vzdálený terč a tento fakt zkreslil souhrnné statistiky (a zhoršil je pro skvělou zbraň).
Tyto souhrnné statistiky jsou nesmyslné, protože i když to tak na první pohled nevypadá (v obou případech se střílí do terče), dávají se dohromady hrušky a jablka.
8. Netranzitivní kostky
Každý má jednu kostku, vítězem je ten, kdo hodí vyšší číslo. Máme tři zvláštní kostky, každá má jiná čísla:
Kostka A: 1 1 6 6 8 8
Kostka B: 2 2 4 4 9 9
Kostka C: 3 3 5 5 7 7
Soupeři nabídnu, ať si jako první vybere jakoukoliv kostku.
Já si ze zbylých dvou vždycky najdu lepší! (A < B, B < C, C < A)
(Podrobněji je to popsáno v knize Simpsonovi a jejich matematická tajemství.)