Paradoks Lorda

Z Wikipedii, wolnej encyklopedii
Dwuwymiarowy wykres punktowy przedstawiający dwa skupiska obserwacji, o identycznych rozkładach normalnych na obu osiach, z międzygrupową różnicą średnich.
Ogólny rozkład danych z prostej symulacji paradoksu Lorda. Na osi X waga przed, a na osi Y po okresie stosowania diety.

Paradoks Lordapozorny paradoks statystyczny, opisujący sytuację badawczą, której analiza na dwa klasyczne sposoby prowadzi do całkowicie przeciwnych wniosków. Różnica wiąże się z tym, czy i jak badacze kontrolują statystycznie początkowy poziom badanych zmiennych[1]. Jest wariantem paradoksu Simpsona, i ilustruje nadrzędność wnioskowania przyczynowego (założeń oraz pytań dotyczących związków przyczynowych) wobec opisu statystycznego[2][3][4].

Oryginalny opis[edytuj | edytuj kod]

Jednowymiarowy wykres kropkowy przedstawiający zmianę wagi obserwacji w obu grupach.
Ilustracja pierwszej analizy: zmiany wagi (na osi X) symulowanych obserwacji wewnątrz obu grup mają grupową średnią równą zero.
Dwuwymiarowy wykres punktowy przedstawiający zależność zmiany wagi względem wagi początkowej w obu grupach. Zaznaczona linia regresji świadczy o wyraźnej negatywnej korelacji.
Ilustracja drugiej analizy: w każdej z grup osobna zmiana wagi (na osi Y) przebiegały w systematyczny sposób w relacji do wagi początkowej (na osi X). W przyjętej tu symulacji zależność odpowiada regresji do średniej, możliwe są także inne związki.

W pierwszej prezentacji problemu z 1967, psychometryk Frederic M. Lord opisał hipotetyczne badanie wpływu diety na wagę studentów, o prostej konstrukcji: 2 grupy (kobiety i mężczyźni) × 2 pomiary wagi (przed i po). Przedstawił przykładowe dane, w których stany wyjściowe w obu grupach: i stany końcowe: charakteryzuje równa różnica: Opisał następnie dwa możliwe, poprawne arytmetycznie, sposoby analizy takich danych, prowadzące do sprzecznych wniosków. Uznał, że oba podejścia mogą być prawidłowe, nie proponując rozwiązania paradoksu – klarownej reguły co do tego, którą metodę wybierać w jakich sytuacjach[1].

Pierwsza analiza skupia się na tym, że średnia waga w każdej grupie, oraz różnica średnich wag pomiędzy grupami, pozostaje identyczna w obu pomiarach – co prowadzi do konkluzji o braku zmiany, którą można potwierdzić np. testem t Studenta lub analizą wariancji, i co można interpretować jako „diety nie różnią się efektywnością”:

[3].

Druga analiza bierze poprawkę na początkową wagę w obu grupach, np. przez analizę kowariancji. Choć średnie w obu grupach nie zmieniły się, to indywidualne wagi nie musiały pozostać identyczne. O ile tak się nie stało – jak implicite zakłada Lord – i ich korelacja nie jest całkowita, to podejście wykrywa pewną różnicę, którą można interpretować jako „diety mają wpływ na zmianę wagi”:

[3].

Lord przedstawił w następnych latach kilka dodatkowych przykładów o tej podobnej strukturze. Skłaniał się stopniowo do przekonania, że w oryginalnym scenariuszu niewłaściwe było drugie podejście, i przestrzegał przed nieostrożnym stosowaniem analizy kowariancji[5][6].

Odpowiedzi[edytuj | edytuj kod]

Pozorny paradoks przyciągnął szereg prób rozwiązania, oraz rozwinięcia i uzupełnienia problemu. Odnieśli się do niego między innymi autorzy dwóch spośród głównych współczesnych podejść do wnioskowania przyczynowego – Donald Rubin i Judea Pearl.

Holland i Rubin[edytuj | edytuj kod]

Holland i Rubin omówili paradoks Lorda w 1982[3]. Zgodzili się, że obie analizy są równie poprawne jako statystyczny opis stanu rzeczy. Zaznaczyli jednak, że badanie, które nie zawiera randomizowanej manipulacji eksperymentalnej (lub jej quasi-eksperymentalnego przybliżenia), i nie tworzy grupy kontrolnej i grupy eksperymentalnej (lub ich odpowiednika), nie daje samo w sobie podstawy do wyciągania wniosków o związkach przyczynowych. Podstawowym problemem przykładu Lorda jest więc brak grup kontrolnych przy wszystkich branych pod uwagę zmiennych objaśniających. Brak ten można próbować załagodzić przez przyjęcie dodatkowych założeń, jednak różne założenia pozwalają na uzasadnienie obu przedstawionych analiz, i – ponieważ bez grupy kontrolnej nie da się ich przetestować – nie można pomiędzy nimi rozstrzygnąć. Scenariusz przedstawiony przez Lorda opisuje zatem jedynie źle zaprojektowane badanie.

Pearl[edytuj | edytuj kod]

Pearl przedstawił swoją ocenę paradoksu m.in. w publikacji z 2016[2] i książce z 2018[7]. Pearl wyraził także przekonanie, że konstrukcja badania nie pozwala na ogólne porównanie efektu obu diet. Uznał jednak, że sam Lord był tego świadomy i zadaniem analizy miała być ocena różnicowego efektu konkretnej diety w obu grupach. Zdaniem Pearla, pierwsza analiza jest w tym przypadku prawidłowa, ponieważ waga początkowa jest mediatorem efektu płci i nie należy jej kontrolować. Uznał za błąd Hollanda i Rubina przyjęcie, że ponieważ płeć nie poddaje się randomizowaniu, to oryginalny scenariusz jest całkowicie nieinformatywny. Zaznaczył także, że gdyby diety nie były przydzielane według płci ale w losowy sposób, struktura przyczynowa badania byłaby zupełnie inna i to drugie podejście byłoby właściwe.

Znaczenie[edytuj | edytuj kod]

Odwołujące się do paradoksu Lorda krytyki metodologii badań stosujących lub rezygnujących z analizy kowariancji opublikowano m.in. w psychologii poznawczej[8] i różnic indywidualnych[9], medycynie[10], psychiatrii i psychologii klinicznej[11] czy w pedagogice[12].

Przypisy[edytuj | edytuj kod]

  1. a b F.M. Lord, A paradox in the interpretation of group comparisons, „Psychological Bulletin”, 68 (5), 1967, s. 304–305, ISSN 0033-2909, PMID6062585 [dostęp 2019-03-13].
  2. a b Judea Pearl, Lord’s Paradox Revisited – (Oh Lord! Kumbaya!), „Journal of Causal Inference”, 4 (2), 2016, DOI10.1515/jci-2016-0021, ISSN 2193-3677 [dostęp 2019-03-13].
  3. a b c d Paul W. Holland, Donald B. Rubin, On Lord’s Paradox, „ETS Research Report Series”, 1982 (2), 1982, i–41, DOI10.1002/j.2333-8504.1982.tb01321.x [dostęp 2019-03-13] (ang.).
  4. Yu-Kang Tu, David Gunnell, Mark S. Gilthorpe, Simpson’s Paradox, Lord’s Paradox, and Suppression Effects are the same phenomenon – the reversal paradox, „Emerging Themes in Epidemiology”, 5 (1), 2008, s. 2, DOI10.1186/1742-7622-5-2, ISSN 1742-7622, PMID18211676, PMCIDPMC2254615 [dostęp 2019-03-13].
  5. Frederic M. Lord, Statistical adjustments when comparing preexisting groups, „ETS Research Bulletin Series”, 1968 (2), 1968, i–4, DOI10.1002/j.2333-8504.1968.tb00724.x [dostęp 2019-03-13] (ang.).
  6. Frederic M. Lord, Lord’s paradox, [w:] S.B. Anderson, S. Ball, R.T. Murphy (red.), Encyclopedia of Educational Evaluation, (za: Holland i Rubin, op.cit.), San Francisco, CA: Jossey-Bass, 1975, s. 232–236.
  7. 6. Paradoxes Galore!, [w:] Judea Pearl, Dana Mackenzie, The book of why: the new science of cause and effect, First edition, New York, NY, 15 maja 2018, ISBN 978-0-465-09760-9, OCLC 1003311466 [dostęp 2019-03-13].
  8. Olle Häggström, Kimmo Eriksson, Lord’s Paradox in a Continuous Setting and a Regression Artifact in Numerical Cognition Research, „PLOS ONE”, 9 (4), 2014, e95949, DOI10.1371/journal.pone.0095949, ISSN 1932-6203, PMID24752244, PMCIDPMC3994136 [dostęp 2019-03-13] (ang.).
  9. Kimmo Sorjonen i inni, Refractive state, intelligence, education, and Lord’s paradox, „Intelligence”, 61, 2017, s. 115–119, DOI10.1016/j.intell.2017.01.011 [dostęp 2019-03-13] (ang.).
  10. Stephen Senn, Change from baseline and analysis of covariance revisited, „Statistics in Medicine”, 25 (24), 2006, s. 4334–4344, DOI10.1002/sim.2682 [dostęp 2019-03-13] (ang.).
  11. Gerard J.P. van Breukelen, ANCOVA Versus CHANGE From Baseline in Nonrandomized Studies: The Difference, „Multivariate Behavioral Research”, 48 (6), 2013, s. 895–922, DOI10.1080/00273171.2013.831743, ISSN 0027-3171 [dostęp 2019-03-13] (ang.).
  12. Donald B. Rubin, Elizabeth A. Stuart, Elaine L. Zanutto, A Potential Outcomes View of Value-Added Assessment in Education, „Journal of Educational and Behavioral Statistics”, 29 (1), 2004, s. 103–116, DOI10.3102/10769986029001103, ISSN 1076-9986 [dostęp 2019-03-13] (ang.).