Paradoks Simpsona
| Ten artykuł od 2012-02 wymaga uzupełnienia źródeł podanych informacji. Możliwe, że ten artykuł w całości albo w części zawiera informacje nieprawdziwe. Informacje bez źródeł w każdej chwili mogą zostać zakwestionowane i usunięte. Pomóż Wikipedii i dodaj przypisy do materiałów opublikowanych w wiarygodnych źródłach. |
| Ten artykuł należy dopracować zgodnie z zaleceniami edycyjnymi: poprawić styl – powinien mieć encyklopedyczną formę. Po wyeliminowaniu niedoskonałości prosimy usunąć szablon {{Dopracować}} z kodu tego artykułu. |
Paradoks Simpsona jest paradoksem statystycznym opisanym przez E. H. Simpsona w 1951 roku. Polega on na tym, że efekt działania kilku grup wydaje się odwrócony, kiedy grupy są połączone. Ten pozornie niemożliwy efekt niespodziewanie pojawia się w naukach społecznych i statystyce związanej z medycyną, kiedy zmienna ważona, która różni się od wartości określonej indywidualnie dla poszczególnych grup, jest używana do oceny połączonych grup.
Wyjaśnienie na przykładzie [edytuj]
Dla zilustrowania paradoksu wyobraźmy sobie dwie osoby, Alę i Janka, które edytują artykuły Wikipedii. W pierwszym tygodniu Ala poprawia 60% artykułów, które edytuje, podczas kiedy Janek poprawia 90% artykułów. W drugim tygodniu Ala poprawia tylko 10% edytowanych artykułów, a Janek 30%.
W obydwu przypadkach Janek poprawił dużo większy procent artykułów niż Ala. Jednak kiedy połączymy wyniki osiągnięte w obydwu tygodniach, może się okazać, że to Ala poprawiła znacznie większy procent artykułów niż Janek!
| Tydzień 1 | Tydzień 2 | Razem | |
| Ala | 60.0% | 10.0% | 55.5% |
| Janek | 90.0% | 30.0% | 35.5% |
Przyczyną powyższego paradoksu jest różna liczba artykułów, jakie mogły być edytowane przez każdą osobę - ta informacja pierwotnie nie była podana. Przyjmijmy przykładowo, że w pierwszym tygodniu Ala edytuje 100 artykułów, poprawiając 60 spośród nich; Janek edytuje tylko 10 artykułów, poprawiając wszystkie z wyjątkiem jednego. A zatem procentowo Janek poprawił więcej, ale w liczbach bezwzględnych - mniej. W drugim tygodniu Ala edytuje tylko 10 artykułów, poprawiając jeden; Janek edytuje 100 artykułów, poprawiając 30. Kiedy połączymy dwutygodniowy rezultat pracy, okaże się, że Ala i Janek dokonali edycji takiej samej liczby artykułów, jednak Ala poprawiła 55% z nich (wszystkich 61), a Janek poprawił tylko 35% z nich (wszystkich 39).
| Tydzień 1 | Tydzień 2 | Razem | |
| Ala | 60 / 100 | 1 / 10 | 61 / 110 |
| Janek | 9 / 10 | 30 / 100 | 39 / 110 |
Podsumowując i wprowadzając niektóre oznaczenia użyte w dalszej treści:
- W pierwszym tygodniu
-
— Ala poprawiła 60% artykułów ze wszystkich, które edytowała.
— Janek poprawił 90% w tym samym czasie.
- Więcej procentowo poprawił Janek.
- W drugim tygodniu
-
— Ala poprawiła 10% artykułów (1 z 10 edytowanych).
— Janek osiągnął wskaźnik sukcesu 30%.
- Więcej procentowo poprawił Janek.
W obydwu przypadkach edycje Janka osiągnęły większy sukces niż edycje Ali. Jeśli jednak połączymy obydwa zbiory, zobaczymy, że Janek i Ala razem dokonali edycji 110 artykułów:
— Ala poprawiła 61 artykułów.
— Janek poprawił tylko 39.
— Więcej procentowo poprawiła Ala.
Janek jest lepszy w obydwu przypadkach, ale łącznie osiągnął gorszy rezultat!
Arytmetyczna podstawa wyjaśnienia paradoksu nie jest kontrowersyjna. Jeśli
i
, intuicja podpowiada, że
musi być większe niż
. Jednak jeśli różne wagi są użyte dla określenia wyniku końcowego dla każdej osoby - wówczas intuicyjne odczucie może zawieść. W tym przypadku pierwsza próba jest ważona
dla Ali i
dla Janka, podczas gdy w drugiej próbie wagi są odwrócone.
Przy jeszcze większym odwróceniu wag dla obydwu prób łączny wynik Ali będzie większy niż 60%, a Janka spadnie poniżej 30%.
Ala ma lepszą skuteczność, ale mówiąc o skuteczności w poszczególnych tygodniach, można pomyśleć, że Janek ma lepszą.
— Ala poprawiła 60% artykułów ze wszystkich, które edytowała.
— Janek poprawił 90% w tym samym czasie.
— Ala poprawiła 10% artykułów (1 z 10 edytowanych).
— Janek osiągnął wskaźnik sukcesu 30%.
— Ala poprawiła 61 artykułów.
— Janek poprawił tylko 39.
— Więcej procentowo poprawiła Ala.
