Metoda syntetycznej kontroli

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania
Wykres liniowy przedstawiający poziom PKB (na osi Y) w kolejnych latach między ok. 1960–1990 (na osi X); zawiera dwie linie, odpowiadające realnemu i syntetycznemu Krajowi Basków, o zbieżnym przebiegu do ok. 1980. W dalszych latach PKB kraju rozwijało się wolniej niż sugeruje porównanie z syntetyczną kontrolą.
Wykres porównujący poziom realnego PKB w Kraju Basków z oszacowanym kontrfaktycznym, syntetycznym stanem gospodarki tego regionu, gdyby nie doszłoby do nasilenia się konfliktu związanego z baskijskim separatyzmem. Wykres opiera się o dane z jednego z pierwszych, głośnych zastosowań metody syntetycznej kontroli, autorstwa zespołu Abadiego i in.[1]

Metoda syntetycznej kontroli (ang. synthetic control method)[a]quasi-eksperymentalna technika analizy danych obserwacyjnych oparta o konstruowanie sztucznej grupy porównawczej na podstawie odpowiednio ważonej kombinacji danych z jednostek obserwacyjnych, które były jak najbardziej podobne w podłużnych szeregach czasowych do grupy eksperymentalnej zanim nie została ona poddana wpływowi badanego czynnika. O ile konstrukcja zapewnia funkcjonalny odpowiednik randomizacji grup w klasycznym eksperymencie, o tyle metoda syntetycznej kontroli daje podstawy do przyczynowej interpretacji danych obserwacyjnych. Innymi słowy, pozwala pryncypialnie oszacować, co działoby się z grupą eksperymentalną, gdyby nie wystąpiły rozważane zjawiska – i jaką wywołały one kontrfaktyczną zmianę. Jest to szczególnie użyteczne w przypadku problemów badawczych, w których uzyskanie precyzyjnej odpowiedzi na pytania przyczynowe jest pożądane, ale realizacja klasycznego eksperymentu jest nieetyczna lub niepraktyczna, co jest charakterystyczne dla nauk medycznych i społecznych[2].

Metoda została opisana i zastosowana przez zespół Abadiego m.in. w pracy z 2003 nt. następstw terroryzmu w Kraju Basków[3], i w pracy z 2010 dot. efektywności kalifornijskiej ustawy przeciwdziałającej paleniu tytoniu[4]. Opiera się o elementy technik różnicy w różnicach i dopasowania, wykorzystując obie z nich w uporządkowany sposób, mający na celu uzyskanie jak najbardziej wiarygodnego i nieobciążonego estymatora. W odróżnieniu od tej pierwszej metody, nie wymaga aby żadna poszczególna jednostka obserwacyjna z grupy porównawczej charakteryzowała się dokładnie takim samym przebiegiem zmian jak grupa eksperymentalna[2].

Centralnym wyzwaniem metody jest dobry wybór grupy porównawczej. Abadie i in. wskazują, że ważne jest uwzględnienie nie tylko powierzchownego podobieństwa szeregów czasowych tej grupy z obiektem badania, ale kluczowe jest także przekonujące teoretyczne i strukturalne uzasadnienie tego, że mechanizmy kształtujące oba szeregi są dogłębnie podobne, i że – idealnie – różnią się one generalnie tylko pod względem dobrze wyodrębnionego analizowanego zjawiska. Autorzy zalecają ponadto, aby przetestować odporność preferowanego modelu na zmiany doboru próby poprzez porównanie go z różnego rodzaju alternatywnymi specyfikacjami w roli „placebo”[2].

Syntetyczne grupy kontrolne wykorzystano w rosnącej liczbie zastosowań empirycznych, m.in. do oszacowania kosztów klęsk żywiołowych[5], czy wpływu zabójstwa politycznego na lokalny rynek mieszkaniowy[6].

Przykładowy opis matematyczny[edytuj | edytuj kod]

Najprostszy przypadek syntetycznej grupy kontrolnej jest definiowany przez zespół Abadiego jako wektor wag dla wektora zmiennych w grupie eksperymentalnej i w grupie porównawczej obejmującej przypadków, Wektor wag ma wymiary odpowiadające liczbie przypadków, z wartościami pomiędzy 0 a 1 włącznie, i sumuje się do 1, Wagi wybiera się jako taką wartość która minimalizuje kwadratowe różnice pomiędzy obserwacjami z obu grup:

Dodatkowe wagi odzwierciedlają relatywne znaczenie, jakie badacze przypisują dokładnemu dopasowaniu grup pod względem zmiennej – gdzie czynniki będące przedmiotem badania powinny mieć wysokie wagi.

Uzyskane parametry wykorzystuje się następne w regresji zmiennej objaśnianej, co po przekształceniu pozwala oszacować wielkość jej kontrfaktycznego efektu.

Wykorzystanie możliwie najdłuższych szeregów czasowych do oszacowania ich wzajemnego podobieństwa, i co za tym idzie – wag – zwiększa wiarygodność rezultatu[2].

Uwagi[edytuj | edytuj kod]

  1. Pojęcie syntetycznej kontroli jest na ten moment bardzo rzadko przekładane na język polski, i być może najwłaściwsze jest stosowanie angielskiego terminu. Tu użyte tłumaczenie występuje w niezidentyfikowanym „Słowniczku” Banku Światowego; tłumaczenie raportu KE stosuje określenie „syntetyczna grupa kontrolna”.

Przypisy[edytuj | edytuj kod]

  1. Jens Hainmueller, Alexis Diamond, Alberto Abadie, Synth: An R Package for Synthetic Control Methods in Comparative Case Studies, „Journal of Statistical Software”, 42 (1), 2011, s. 1–17, DOI10.18637/jss.v042.i13, ISSN 1548-7660 [dostęp 2019-03-24] (ang.).
  2. a b c d Alberto Abadie, Alexis Diamond, Jens Hainmueller, Comparative Politics and the Synthetic Control Method, „American Journal of Political Science”, 59 (2), 2015, s. 495–510, DOI10.1111/ajps.12116, ISSN 1540-5907 [dostęp 2019-03-05] (ang.).
  3. Javier Gardeazabal, Alberto Abadie, The Economic Costs of Conflict: A Case Study of the Basque Country, „American Economic Review”, 93 (1), 2003, s. 113–132, DOI10.1257/000282803321455188, ISSN 0002-8282 [dostęp 2019-03-05] (ang.).
  4. Alberto Abadie, Alexis Diamond, Jens Hainmueller, Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California’s Tobacco Control Program, „Journal of the American Statistical Association”, 105 (490), 2010, s. 493–505, DOI10.1198/jasa.2009.ap08746, ISSN 0162-1459 [dostęp 2019-03-05].
  5. Eduardo Cavallo i inni, Catastrophic Natural Disasters and Economic Growth, „The Review of Economics and Statistics”, 95 (5), 2013, s. 1549–1561, DOI10.1162/REST_a_00413, ISSN 0034-6535 [dostęp 2019-03-05].
  6. Pieter A. Gautier, Arjen Siegmann, Aico Van Vuuren, Terrorism and attitudes towards minorities: The effect of the Theo van Gogh murder on house prices in Amsterdam, „Journal of Urban Economics”, 65 (2), 2009, s. 113–126, DOI10.1016/j.jue.2008.10.004 [dostęp 2019-03-05] (ang.).