Współczynnik determinacji: Różnice pomiędzy wersjami
[wersja przejrzana] | [wersja przejrzana] |
robocza aktualizacja, źródła, tl;dr: r2 nie jest dobrą miarą jakości modelu. artykuł nadal wymaga dużo poprawek |
|||
Linia 1: | Linia 1: | ||
'''Współczynnik determinacji R²''' – jedna z |
'''Współczynnik determinacji R²''' – jedna z historycznych [[Miara (matematyka)|miar]] [[Jakość|jakości]] dopasowania [[Model statystyczny|modelu]] do danych uczących. Jego dopełnieniem jest '''współczynnik zbieżności''', '''<math>\varphi^2 = 1- R^2</math>'''. Występuje obecnie w wielu wariantach stosujących różnorodne poprawki. Jego pierwotne opracowanie przypisuje się m.in. publikacji [[Sewall Wright|Sewalla Wrighta]] z 1921, która opiera się z kolei m.in. na artykule [[Karl Pearson|K. Pearsona]] z 1897<ref>{{Cytuj |autor = Sewall Wright |tytuł = Correlation and causation |czasopismo = Journal of agricultural research |data = 1921 |wolumin = 20 |numer = 7 |s = s. 557–585 |url = https://www.ssc.wisc.edu/soc/class/soc952/Wright/Wright_Correlation%20and%20Causation.pdf}}</ref>. |
||
:: 0,0 – 0,5 – dopasowanie niezadowalające |
|||
Współczynnik determinacji nie jest uznawany współcześnie za dobrą miarę dopasowania, i wykorzystuje się go głównie w celach pomocniczych. Lepszymi narzędziami do tego celu są np. kryteria informacyjne [[Kryterium informacyjne Akaikego|AIC]], [[Bayesowskie kryterium informacyjne Schwarza|BIC]], czy [[sprawdzian krzyżowy]]. Już Wright nie przedstawiał R² jako wyczerpującej miary dopasowania modelu do badanego zjawiska, szczególnie nie w sensie [[Wnioskowanie przyczynowe|wyjaśnienia przyczynowego]]. Współczynnik determinacji opisuje jedynie oszacowaną na podstawie próby macierz wielokrotnej [[Zależność zmiennych losowych|korelacji]] obecnych w modelu zmiennych, przy założeniu prawdziwości modelu. Ignoruje dopasowanie modelu do danych spoza próby, oraz problem zmiennych ubocznych. Maksymalizacja tej miary prowadzi do [[Nadmierne dopasowanie|nadmiernego dopasowania]] modelu do danych uczących<ref>{{Cytuj |autor = Norman H. Anderson, James Shanteau |tytuł = Weak inference with linear models. |czasopismo = Psychological Bulletin |data = 1977 |data dostępu = 2019-03-28 |issn = 0033-2909 |wolumin = 84 |numer = 6 |s = 1155–1170 |doi = 10.1037/0033-2909.84.6.1155 |url = http://content.apa.org/journals/bul/84/6/1155 |język = en}}</ref><ref>{{Cytuj |autor = Michael H. Birnbaum |tytuł = The devil rides again: Correlation as an index of fit. |czasopismo = Psychological Bulletin |data = 1973-4 |data dostępu = 2019-03-28 |issn = 1939-1455 |wolumin = 79 |numer = 4 |s = 239–242 |doi = 10.1037/h0033853 |url = http://doi.apa.org/getdoi.cfm?doi=10.1037/h0033853 |język = en}}</ref><ref>{{Cytuj |autor = James Shanteau |tytuł = Correlation as a deceiving measure of fit |czasopismo = Bulletin of the Psychonomic Society |data = 1977-8 |data dostępu = 2019-03-28 |issn = 0090-5054 |wolumin = 10 |numer = 2 |s = 134–136 |doi = 10.3758/BF03329303 |url = http://link.springer.com/10.3758/BF03329303 |język = en}}</ref><ref>{{Cytuj |autor = Andrej-Nikolai Spiess, Natalie Neumeyer |tytuł = An evaluation of R2 as an inadequate measure for nonlinear models in pharmacological and biochemical research: a Monte Carlo approach |czasopismo = BMC Pharmacology |data = 2010-12 |data dostępu = 2019-03-28 |issn = 1471-2210 |wolumin = 10 |numer = 1 |doi = 10.1186/1471-2210-10-6 |pmid = 20529254 |pmc = PMC2892436 |url = http://link.springer.com/10.1186/1471-2210-10-6 |język = en}}</ref>. Schmueli uznaje w tym kontekście tradycję opisywania korelacji zmiennych jako ich wzajemnego „wyjaśniania” – co może sugerować wyjaśnienie przyczynowe – za szczególnie zwodniczą<ref>{{Cytuj |autor = Galit Shmueli |tytuł = To Explain or to Predict? |czasopismo = Statistical Science |data = 2010-8 |data dostępu = 2019-03-28 |issn = 0883-4237 |wolumin = 25 |numer = 3 |s = 289–310 |doi = 10.1214/10-STS330 |url = http://projecteuclid.org/euclid.ss/1294167961 |język = en}}</ref>. |
|||
:: 0,5 – 0,6 – dopasowanie słabe |
|||
:: 0,6 – 0,8 – dopasowanie zadowalające |
|||
:: 0,8 – 0,9 – dopasowanie dobre |
|||
:: 0,9 – 1,0 – dopasowanie bardzo dobre |
|||
== Współczynnik determinacji == |
== Współczynnik determinacji == |
||
Informuje o tym, jaka część zmienności ([[wariancja]]) [[Zmienna objaśniana|zmiennej objaśnianej]] |
Informuje o tym, jaka część zmienności ([[wariancja|wariancji]]) [[Zmienna objaśniana|zmiennej objaśnianej]] w próbie pokrywa się z korelacjami ze zmiennymi zawartymi w [[Model statystyczny|modelu]]. Jest on więc miarą stopnia, w jakim model pasuje do próby. Współczynnik determinacji przyjmuje wartości z [[przedział (matematyka)|przedziału]] [0;1] jeśli w modelu występuje wyraz wolny, a do estymacji parametrów wykorzystano metodę najmniejszych kwadratów. Jego wartości najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość R² jest bliższa jedności. Wyraża się on wzorem: |
||
: <math>R^2 = \frac{\sum\limits_{t=1}^n (\hat y_t - \overline{y})^2}{\sum\limits_{t=1}^n (y_t - \overline{y})^2},</math> |
: <math>R^2 = \frac{\sum\limits_{t=1}^n (\hat y_t - \overline{y})^2}{\sum\limits_{t=1}^n (y_t - \overline{y})^2},</math> |
||
gdzie: |
gdzie: |
||
: <math>y_t</math> – rzeczywista |
: <math>y_t</math> – rzeczywista wartość zmiennej Y w momencie t, |
||
: <math>\hat y_t</math> – |
: <math>\hat y_t</math> – wartość teoretyczna [[Zmienna objaśniana|zmiennej objaśnianej]] (na podstawie modelu), |
||
: <math>\overline{y}</math> – [[średnia arytmetyczna]] empirycznych wartości zmiennej objaśnianej. |
: <math>\overline{y}</math> – [[średnia arytmetyczna]] empirycznych wartości zmiennej objaśnianej. |
||
== Współczynnik zbieżności == |
== Współczynnik zbieżności == |
||
Współczynnik zbieżności <math>\varphi^2</math> określa, jaka część zmienności zmiennej objaśnianej '''nie''' |
Współczynnik zbieżności <math>\varphi^2</math> określa, jaka część zaobserwowanej w próbie zmienności zmiennej objaśnianej '''nie''' pasuje do modelu (mieści się w jego błędzie). Współczynnik zbieżności przyjmuje wartości z przedziału [0;1]; wartości te najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość <math>\varphi^2</math> jest bliższa zeru. Wyraża się on wzorem: |
||
: <math>\varphi^2 = 1- R^2,</math> |
: <math>\varphi^2 = 1- R^2,</math> |
||
Wersja z 23:58, 28 mar 2019
Współczynnik determinacji R² – jedna z historycznych miar jakości dopasowania modelu do danych uczących. Jego dopełnieniem jest współczynnik zbieżności, . Występuje obecnie w wielu wariantach stosujących różnorodne poprawki. Jego pierwotne opracowanie przypisuje się m.in. publikacji Sewalla Wrighta z 1921, która opiera się z kolei m.in. na artykule K. Pearsona z 1897[1].
Współczynnik determinacji nie jest uznawany współcześnie za dobrą miarę dopasowania, i wykorzystuje się go głównie w celach pomocniczych. Lepszymi narzędziami do tego celu są np. kryteria informacyjne AIC, BIC, czy sprawdzian krzyżowy. Już Wright nie przedstawiał R² jako wyczerpującej miary dopasowania modelu do badanego zjawiska, szczególnie nie w sensie wyjaśnienia przyczynowego. Współczynnik determinacji opisuje jedynie oszacowaną na podstawie próby macierz wielokrotnej korelacji obecnych w modelu zmiennych, przy założeniu prawdziwości modelu. Ignoruje dopasowanie modelu do danych spoza próby, oraz problem zmiennych ubocznych. Maksymalizacja tej miary prowadzi do nadmiernego dopasowania modelu do danych uczących[2][3][4][5]. Schmueli uznaje w tym kontekście tradycję opisywania korelacji zmiennych jako ich wzajemnego „wyjaśniania” – co może sugerować wyjaśnienie przyczynowe – za szczególnie zwodniczą[6].
Współczynnik determinacji
Informuje o tym, jaka część zmienności (wariancji) zmiennej objaśnianej w próbie pokrywa się z korelacjami ze zmiennymi zawartymi w modelu. Jest on więc miarą stopnia, w jakim model pasuje do próby. Współczynnik determinacji przyjmuje wartości z przedziału [0;1] jeśli w modelu występuje wyraz wolny, a do estymacji parametrów wykorzystano metodę najmniejszych kwadratów. Jego wartości najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość R² jest bliższa jedności. Wyraża się on wzorem:
gdzie:
- – rzeczywista wartość zmiennej Y w momencie t,
- – wartość teoretyczna zmiennej objaśnianej (na podstawie modelu),
- – średnia arytmetyczna empirycznych wartości zmiennej objaśnianej.
Współczynnik zbieżności
Współczynnik zbieżności określa, jaka część zaobserwowanej w próbie zmienności zmiennej objaśnianej nie pasuje do modelu (mieści się w jego błędzie). Współczynnik zbieżności przyjmuje wartości z przedziału [0;1]; wartości te najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość jest bliższa zeru. Wyraża się on wzorem:
lub też
gdzie oraz są określone jak w części poprzedniej.
- ↑ Sewall Wright , Correlation and causation, „Journal of agricultural research”, 20 (7), 1921, s. 557–585 .
- ↑ Norman H. Anderson , James Shanteau , Weak inference with linear models., „Psychological Bulletin”, 84 (6), 1977, s. 1155–1170, DOI: 10.1037/0033-2909.84.6.1155, ISSN 0033-2909 [dostęp 2019-03-28] (ang.).
- ↑ Michael H. Birnbaum , The devil rides again: Correlation as an index of fit., „Psychological Bulletin”, 79 (4), 1973, s. 239–242, DOI: 10.1037/h0033853, ISSN 1939-1455 [dostęp 2019-03-28] (ang.).
- ↑ James Shanteau , Correlation as a deceiving measure of fit, „Bulletin of the Psychonomic Society”, 10 (2), 1977, s. 134–136, DOI: 10.3758/BF03329303, ISSN 0090-5054 [dostęp 2019-03-28] (ang.).
- ↑ Andrej-Nikolai Spiess , Natalie Neumeyer , An evaluation of R2 as an inadequate measure for nonlinear models in pharmacological and biochemical research: a Monte Carlo approach, „BMC Pharmacology”, 10 (1), 2010, DOI: 10.1186/1471-2210-10-6, ISSN 1471-2210, PMID: 20529254, PMCID: PMC2892436 [dostęp 2019-03-28] (ang.).
- ↑ Galit Shmueli , To Explain or to Predict?, „Statistical Science”, 25 (3), 2010, s. 289–310, DOI: 10.1214/10-STS330, ISSN 0883-4237 [dostęp 2019-03-28] (ang.).