Simpsonův paradox

Kapitoly: Problém tří dveří, Pravděpodobnostní lhářův paradox, Vázankový paradox, Simpsonův paradox, Lékařský paradox, Petrohradský paradox, Netransitivní kostky

Simpsonův paradox je statistický paradox pojemnovaný po britském statistikovi. Paradox spočívá v tom, že máme-li dva subjekty, přičemž jeden z nich je ve všech pozorováních úspěšnější než druhý, může se stát, že v celkovém součtu bude úspěšnější ten druhý.

Příklad

Máme dva různé studenty na dvou různých školách studující dva různé obory. Říkejme jim Jana a Martin. Oba dva píší za semestr ve svém předmětu dva testy. Jana má v prvním úspěšnost 30 % a ve druhém 100 %. Martin má v prvním úspěšnost 25 % a ve druhém 75 %.

Zdá se, že Jana je úspěšnější studentka. Ovšem pokud doplníme počet správně zodpovězených otázek, už se to tak nemusí jevit. Podstatou problému je, že Jana s Martinem psali různé testy, protože chodlili na různé školy.

Jana totiž v prvním testu mohla odpovědět správně na 3 z 10 otázek (30% úspěšnost) a pak na 2 ze 2 otázek (100%). Celkem tak zodpověděla správně 5 z 12 otázek. Martin mohl zodpovědět správně 1 ze 4 (25%) a pak 6 z 8 otázek (75%). Celkem tak zodpověděl 7 z 12 otázek. Z tohoto pohledu už je zase úspěšnější Martin.

Simpsonův paradox je docela obvyklý a není na něm nic nepochopitelného. Je pojmenovaný po Edwardu H. Simpsonovi, který tento jev jako první pořádně popsal — první výskyty tohoto paradoxu samozřejmě byly i předtím.