Współczynnik determinacji

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania
Cztery wykresy punktowe przedstawiające fikcyjne dane, z dopasowanym modelem liniowym. Dane mają mocno różną postać funkcjonalną.
Kwartet Anscombe`a – cztery zbiory obserwacji, które pasują w identycznym stopniu (także w sensie R2) do takiego samego modelu liniowego.

Współczynnik determinacji R² – jedna z historycznych miar jakości dopasowania modelu do danych uczących. Jego dopełnieniem jest współczynnik zbieżności, . Występuje obecnie w wielu wariantach stosujących różnorodne poprawki. Jego pierwotne opracowanie przypisuje się m.in. publikacji Sewalla Wrighta z 1921, która opiera się z kolei m.in. na artykule K. Pearsona z 1897[1].

Współczynnik determinacji nie jest uznawany współcześnie za dobrą miarę dopasowania, i wykorzystuje się go głównie w celach pomocniczych. Lepszymi narzędziami do tego celu są np. kryteria informacyjne AIC, BIC, czy sprawdzian krzyżowy. Już Wright nie przedstawiał R² jako wyczerpującej miary dopasowania modelu do badanego zjawiska, szczególnie nie w sensie wyjaśnienia przyczynowego. Współczynnik determinacji opisuje jedynie oszacowaną na podstawie próby macierz wielokrotnej korelacji obecnych w modelu zmiennych, przy założeniu prawdziwości modelu. Ignoruje dopasowanie modelu do danych spoza próby, oraz problem pominiętych zmiennych. Maksymalizacja tej miary prowadzi do nadmiernego dopasowania modelu do danych uczących[2][3][4][5]. Schmueli uznaje w tym kontekście tradycję opisywania korelacji zmiennych jako ich wzajemnego wyjaśniania lub determinacji – co może sugerować wytłumaczenie przyczynowe – za szczególnie zwodniczą[6].

Współczynnik determinacji[edytuj | edytuj kod]

Informuje o tym, jaka część zmienności (wariancji) zmiennej objaśnianej w próbie pokrywa się z korelacjami ze zmiennymi zawartymi w modelu. Jest on więc miarą stopnia, w jakim model pasuje do próby. Współczynnik determinacji przyjmuje wartości z przedziału [0;1] jeśli w modelu występuje wyraz wolny, a do estymacji parametrów wykorzystano metodę najmniejszych kwadratów. Jego wartości najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość R² jest bliższa jedności. Wyraża się on wzorem:

gdzie:

– rzeczywista wartość zmiennej Y w momencie t,
– wartość teoretyczna zmiennej objaśnianej (na podstawie modelu),
średnia arytmetyczna empirycznych wartości zmiennej objaśnianej.

Współczynnik zbieżności[edytuj | edytuj kod]

Współczynnik zbieżności określa, jaka część zaobserwowanej w próbie zmienności zmiennej objaśnianej nie pasuje do modelu (mieści się w jego błędzie). Współczynnik zbieżności przyjmuje wartości z przedziału [0;1]; wartości te najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość jest bliższa zeru. Wyraża się on wzorem:

lub też

gdzie oraz są określone jak w części poprzedniej.

Przypisy[edytuj | edytuj kod]

  1. Sewall Wright, Correlation and causation, „Journal of agricultural research”, 20 (7), 1921, s. 557–585.
  2. Norman H. Anderson, James Shanteau, Weak inference with linear models., „Psychological Bulletin”, 84 (6), 1977, s. 1155–1170, DOI10.1037/0033-2909.84.6.1155, ISSN 0033-2909 [dostęp 2019-03-28] (ang.).
  3. Michael H. Birnbaum, The devil rides again: Correlation as an index of fit., „Psychological Bulletin”, 79 (4), 1973, s. 239–242, DOI10.1037/h0033853, ISSN 1939-1455 [dostęp 2019-03-28] (ang.).
  4. James Shanteau, Correlation as a deceiving measure of fit, „Bulletin of the Psychonomic Society”, 10 (2), 1977, s. 134–136, DOI10.3758/BF03329303, ISSN 0090-5054 [dostęp 2019-03-28] (ang.).
  5. Publikacja w otwartym dostępie – możesz ją bezpłatnie przeczytać Andrej-Nikolai Spiess, Natalie Neumeyer, An evaluation of R2 as an inadequate measure for nonlinear models in pharmacological and biochemical research: a Monte Carlo approach, „BMC Pharmacology”, 10 (1), 2010, DOI10.1186/1471-2210-10-6, ISSN 1471-2210, PMID20529254, PMCIDPMC2892436 [dostęp 2019-03-28] (ang.).
  6. Galit Shmueli, To Explain or to Predict?, „Statistical Science”, 25 (3), 2010, s. 289–310, DOI10.1214/10-STS330, ISSN 0883-4237 [dostęp 2019-03-28] (ang.).