Test Wilcoxona dla par obserwacji

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Test Wilcoxona dla par obserwacji jest nieparametryczną alternatywą dla testu t-Studenta dla przypadku dwóch równolicznych próbek dających się połączyć w pary. Często używa się tego testu do porównywania danych zebranych przed i po eksperymencie, w celu zbadania, czy nastąpiła istotna statystycznie zmiana.

Porównanie z testem t-Studenta[edytuj | edytuj kod]

O ile test t-Studenta sprawdza hipotezę zerową o równości średnich arytmetycznych w odpowiadających im populacjach, test Wilcoxona weryfikuje równość median.

Tak jak test t-Studenta, test Wilcoxona bazuje na różnicach pomiędzy wartościami cech z porównywanych zbiorów, stąd również wymaga zmiennych na skali interwałowej. W przeciwieństwie jednak do testu t-Studenta, nie posiada założeń dotyczących rozkładu próby. Może zatem być używany w sytuacjach, gdy założenia testu t-Studenta nie są spełnione.

Dane[edytuj | edytuj kod]

Załóżmy, że zebraliśmy 2n obserwacji, po dwie dla każdego z n przypadków. Niech i będzie indeksem danego przypadku, x_i będzie pierwszą, a y_i drugą obserwacją przypadku i.

Założenia[edytuj | edytuj kod]

  1. Niech d_i=y_i-x_i\; dla i=1\dots n\;. Zakłada się, że różnice d_i\;niezależne.
  2. Każda różnica d_i\; pochodzi z populacji o identycznym ciągłym rozkładzie, symetryczny względem wspólnej mediany \theta\;

Wyliczanie statystyki Wilcoxona[edytuj | edytuj kod]

Testowaną hipotezą zerową jest:

H_0: \theta=0\;

Algorytm wyliczania statystyki testu Wilcoxona:

  • Wyliczenie różnic d_i
  • Uporządkowanie wartości bezwzględnych |d_1|,\dots |d_n|
  • Rangowanie tak otrzymanego zbioru. Oznaczamy rangi przez R_i. Rangi związane uzyskują wartość średnią (zob. ranga).
  • Statystyka W^{+} jest zdefiniowana jako suma rang R_i dla których d_i>0

Niekiedy wykonuje się dalsze kroki:

  • Analogicznie obliczana jest statystyka W^{-}, czyli suma rang dla których d_i<0
  • Statystyka S jest obliczana jako:
S=min(W^{+},W^{-})\;

Właściwości statystyki Wilcoxona[edytuj | edytuj kod]

Właściwości statystyki W^{+}:

\mathbb{E}W^{+}=\frac{n(n+1)}{4}
\operatorname{Var}\ W^{+}=\frac{n(n+1)(2n+1)}{24}
  • Dla dowolnej liczby t\;:
\operatorname{P}\left( \frac{W^{+}-\mathbb{E}W^{+}}{\sqrt{Var\ W^{+}}}\leqslant t\right) \rightarrow \Phi(t) gdy n\rightarrow \infty

Do obliczenia p-wartości dla prób o małej liczności (zwykle przyjmuje się n\leqslant 20) korzysta się z tablic statystycznych. Dla dużych prób, używa się przybliżenia rozkładem normalnym, z parametrami podanymi powyżej.

Historia[edytuj | edytuj kod]

Twórcą testu był Frank Wilcoxon (18921965), który zaproponował go w jednym artykule (Wilcoxon, 1945) z innym testem, zwanym obecnie testem Manna-Whitneya-Wilcoxona.

Test Wilcoxona był spopularyzowany przez Siegla (1956) w jego wpływowym podręczniku statystyki nieparametrycznej. Siegel używał symbolu T dla wielkości oznaczanej powyżej przez S. W konsekwencji test czasami jest nazywany testem T Wilcoxona, a statystyka testowa jest podawana jako wartość T.

Zobacz też[edytuj | edytuj kod]

Bibliografia[edytuj | edytuj kod]

  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, s. 467-471.
  • Sidney Siegel: Non-parametric statistics for the behavioral sciences. Nowy York: McGraw-Hill, 1956.
  • Frank Wilcoxon: Individual comparisons by ranking methods. Biometrics, 1945, s. 1, 80-83.

Linki zewnętrzne[edytuj | edytuj kod]

Implementacje[edytuj | edytuj kod]