Test Wilcoxona dla par obserwacji
Test Wilcoxona dla par obserwacji jest nieparametryczną alternatywą dla testu t-Studenta dla przypadku dwóch równolicznych próbek dających się połączyć w pary. Często używa się tego testu do porównywania danych zebranych przed i po eksperymencie, w celu zbadania, czy nastąpiła istotna statystycznie zmiana.
Spis treści |
Porównanie z testem t-Studenta [edytuj]
O ile test t-Studenta sprawdza hipotezę zerową o równości średnich arytmetycznych w odpowiadających im populacjach, test Wilcoxona weryfikuje równość median.
Tak jak test t-Studenta, test Wilcoxona bazuje na różnicach pomiędzy wartościami cech z porównywanych zbiorów, stąd również wymaga zmiennych na skali interwałowej. W przeciwieństwie jednak do testu t-Studenta, nie posiada założeń dotyczących rozkładu próby. Może zatem być używany w sytuacjach, gdy założenia testu t-Studenta nie są spełnione.
Dane [edytuj]
Załóżmy, że zebraliśmy
obserwacji, po dwie dla każdego z n przypadków. Niech
będzie indeksem danego przypadku,
będzie pierwszą, a
drugą obserwacją przypadku
.
Założenia [edytuj]
- Niech
dla
. Zakłada się, że różnice
są niezależne. - Każda różnica
pochodzi z populacji o identycznym ciągłym rozkładzie, symetryczny względem wspólnej mediany 
Wyliczanie statystyki Wilcoxona [edytuj]
Testowaną hipotezą zerową jest:
Algorytm wyliczania statystyki testu Wilcoxona:
- Wyliczenie różnic

- Uporządkowanie wartości bezwzględnych

- Rangowanie tak otrzymanego zbioru. Oznaczamy rangi przez
. Rangi związane uzyskują wartość średnią (zob. ranga). - Statystyka
jest zdefiniowana jako suma rang
dla których 
Niekiedy wykonuje się dalsze kroki:
- Analogicznie obliczana jest statystyka
, czyli suma rang dla których 
- Statystyka
jest obliczana jako:
Właściwości statystyki Wilcoxona [edytuj]
Właściwości statystyki
:
- Dla dowolnej liczby
:
gdy 
Do obliczenia p-wartości dla prób o małej liczności (zwykle przyjmuje się
) korzysta się z tablic statystycznych. Dla dużych prób, używa się przybliżenia rozkładem normalnym, z parametrami podanymi powyżej.
Historia [edytuj]
Twórcą testu był Frank Wilcoxon (1892–1965), który zaproponował go w jednym artykule (Wilcoxon, 1945) z innym testem, zwanym obecnie testem Manna-Whitneya-Wilcoxona.
Test Wilcoxona był spopularyzowany przez Siegla (1956) w jego wpływowym podręczniku statystyki nieparametrycznej. Siegel używał symbolu
dla wielkości oznaczanej powyżej przez
. W konsekwencji test czasami jest nazywany testem T Wilcoxona, a statystyka testowa jest podawana jako wartość
.
Zobacz też [edytuj]
- test t-Studenta
- test Manna-Whitneya-Wilcoxona (wersja dla dwóch próbek)
- test znaków
Bibliografia [edytuj]
- Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, s. 467-471.
- Sidney Siegel: Non-parametric statistics for the behavioral sciences. Nowy York: McGraw-Hill, 1956.
- Frank Wilcoxon: Individual comparisons by ranking methods. Biometrics, 1945, s. 1, 80-83.
Linki zewnętrzne [edytuj]
- Metoda wyliczania p dla testu Wilcoxona (ang.)
- Przykład zastosowania testu Wilcoxona (ang.)
- Wersja testu online (ang.)
Implementacje [edytuj]
- ALGLIB zawiera implementację testu Wilcoxona w C++, C#, Delphi, Visual Basicu, itp.
dla
. Zakłada się, że różnice
są 



. Rangi związane uzyskują wartość średnią (zob. 
, czyli suma rang dla których 



:
gdy 