Kowariancja

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Kowariancja, \operatorname{cov}(X,Y)\ – liczba określająca zależność liniową między zmiennymi losowymi X i Y.

Definicja[edytuj | edytuj kod]

Matematycznie kowariancję definiuje się wzorem:

\operatorname{cov}(X,Y) = \mathrm{E}[(X-\mathrm{E}X) \cdot (Y-\mathrm{E}Y)]\ .

Wygodniejszym, równoważnym wzorem jest:

\operatorname{cov}(X,Y) = \mathrm{E}(X \cdot Y) - \mathrm{E}X \cdot \mathrm{E}Y\
gdzie: \mathrm{E}\ jest wartością oczekiwaną.

Interpretacja[edytuj | edytuj kod]

Jeżeli między zmiennymi losowymi X i Y nie istnieje żadna zauważalna korelacja liniowa i istnieją ich wartości oczekiwane, to kowariancja przyjmuje wartość 0 (nie musi to być prawda dla kowariancji w próbie losowej z tych zmiennych).

Innymi słowy: zmienne losowe X i Y są niezależne, a więc

\mathrm{E}(X \cdot Y)=\mathrm{E}X \cdot \mathrm{E}Y,

zatem:

\operatorname{cov}(X,Y) = \mathrm{E}(X \cdot Y) - \mathrm{E}X \cdot \mathrm{E}Y = \mathrm{E}X \cdot \mathrm{E}Y - \mathrm{E}X \cdot \mathrm{E}Y = 0\

Wartości kowariancji zbliżone, czy nawet równe zero nie świadczą jednak o całkowitej niezależności zmiennych losowych. Zawsze istnieje bowiem możliwość, że są one zależne nieliniowo.

Na przykład, jeśli zmienna losowa Z ma rozkład jednostajny na przedziale [0,2π], a zmienne losowe byłyby zdefiniowane jako:

X=\sin Z\;
Y=\cos Z\;

to pomimo ich oczywistej zależności (jedynka trygonometryczna) mamy \operatorname{cov}(X,Y)=0.

Związek ze współczynnikiem korelacji liniowej[edytuj | edytuj kod]

Kowariancja jest powiązana ze współczynnikiem korelacji Pearsona:

\operatorname{cov}(X,Y)=\operatorname{corr}(X,Y)\sigma_X\sigma_Y

gdzie:

  • \operatorname{corr}(X,Y) to współczynnik korelacji liniowej pomiędzy zmiennymi X i Y
  • \sigma_X\; to odchylenie standardowe zmiennej X\;
  • \sigma_Y\; to odchylenie standardowe zmiennej Y\;

Zobacz też[edytuj | edytuj kod]

WiktionaryPl nodesc.svg
Zobacz hasło kowariancja w Wikisłowniku