Współczynnik korelacji Pearsona
Współczynnik korelacji liniowej Pearsona – współczynnik określający poziom zależności liniowej między zmiennymi losowymi. Został opracowany przez Karla Pearsona
Spis treści |
[edytuj] Wzory matematyczne
Niech x i y będą zmiennymi losowymi o ciągłych rozkładach. xi,yi oznaczają wartości prób losowych tych zmiennych (i = 1,2,...,n), natomiast
- wartości średnie z tych prób, tj.
.
Wówczas estymator współczynnika korelacji liniowej definiuje się następująco:

![r_{xy} \in [-1, 1].](http://upload.wikimedia.org/wikipedia/pl/math/9/b/c/9bc1b0ad88db9e51241dea8a783ea8a5.png)
Ogólnie współczynnik korelacji liniowej dwóch zmiennych jest ilorazem kowariancji i iloczynu odchyleń standardowych tych zmiennych:

W szczególności dla zmiennych losowych o dyskretnych rozkładach ma on postać

Wartość współczynnika korelacji mieści się w przedziale domkniętym [-1, 1]. Im większa jego wartość bezwzględna, tym silniejsza jest zależność liniowa między zmiennymi. rxy = 0 oznacza brak liniowej zależności między cechami, rxy = 1 oznacza dokładną dodatnią liniową zależność między cechami, natomiast rxy = − 1 oznacza dokładną ujemną liniową zależność między cechami, tzn. jeżeli zmienna x rośnie, to y maleje i na odwrót.
Współczynnik korelacji liniowej można traktować jako znormalizowaną kowariancję. Korelacja przyjmuje zawsze wartości w zakresie [-1, 1], co pozwala uniezależnić analizę od dziedziny badanych zmiennych.
[edytuj] Poziomy korelacji i ich interpretacja
| Korelacje | Ujemne | Dodatnie |
|---|---|---|
| Słabe | −0,5 do 0,0 | 0,0 do 0,5 |
| Silne | −1,0 do −0,5 | 0,5 do 1,0 |
Korelacje można interpretować jako silne, słabe, ujemne[1][2]. Interpretacja taka jest jednak arbitralna i nie możemy jej traktować zbyt ściśle. Na przykład współczynnik równy 0,9 dla socjologów i ekonomistów oznacza silną korelację, a dla fizyków posługujących się wysokiej klasy pomiarami przy badaniu praw przyrody oznacza korelację słabą[2]. Z drugiej strony poziom korelacji ma wpływ na czas życia korelacji[1].
[edytuj] Ograniczenia stosowalności
- podatny na obserwacje skrajne.
- interpretacja jest oczywista tylko dla wielowymiarowego rozkładu normalnego (jest wtedy estymatorem elementu macierzy współczynników tego rozkładu).
[edytuj] Zobacz też
- korelacja
- współczynnik korelacji
- macierz korelacji
- współczynnik korelacji rang
- przegląd zagadnień z zakresu statystyki
Przypisy
- ↑ 1,0 1,1 A. Buda and A.Jarynowski (2010) Life-time of correlations and its applications vol.1, Wydawnictwo Niezalezne: 5–21, December 2010, ISBN 978-83-915272-9-0
- ↑ 2,0 2,1 Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.)