Test Wilcoxona dla par obserwacji

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Test Wilcoxona dla par obserwacji jest nieparametryczną alternatywą dla testu t-Studenta dla przypadku dwóch równolicznych próbek dających się połączyć w pary. Często używa się tego testu do porównywania danych zebranych przed i po eksperymencie, w celu zbadania, czy nastąpiła istotna statystycznie zmiana.

Porównanie z testem t-Studenta[edytuj]

O ile test t-Studenta sprawdza hipotezę zerową o równości średnich arytmetycznych w odpowiadających im populacjach, test Wilcoxona weryfikuje równość median.

Tak jak test t-Studenta, test Wilcoxona bazuje na różnicach pomiędzy wartościami cech z porównywanych zbiorów, stąd również wymaga zmiennych na skali interwałowej. W przeciwieństwie jednak do testu t-Studenta, nie posiada założeń dotyczących rozkładu próby. Może zatem być używany w sytuacjach, gdy założenia testu t-Studenta nie są spełnione.

Dane[edytuj]

Załóżmy, że zebraliśmy obserwacji, po dwie dla każdego z n przypadków. Niech będzie indeksem danego przypadku, będzie pierwszą, a drugą obserwacją przypadku .

Założenia[edytuj]

  1. Niech dla . Zakłada się, że różnice niezależne.
  2. Każda różnica pochodzi z populacji o identycznym ciągłym rozkładzie, symetryczny względem wspólnej mediany

Wyliczanie statystyki Wilcoxona[edytuj]

Testowaną hipotezą zerową jest:

Algorytm wyliczania statystyki testu Wilcoxona:

  • Wyliczenie różnic
  • Uporządkowanie wartości bezwzględnych
  • Rangowanie tak otrzymanego zbioru. Oznaczamy rangi przez . Rangi związane uzyskują wartość średnią (zob. ranga).
  • Statystyka jest zdefiniowana jako suma rang dla których

Niekiedy wykonuje się dalsze kroki:

  • Analogicznie obliczana jest statystyka , czyli suma rang dla których
  • Statystyka jest obliczana jako:

Właściwości statystyki Wilcoxona[edytuj]

Właściwości statystyki :

  • Dla dowolnej liczby :
gdy

Do obliczenia p-wartości dla prób o małej liczności (zwykle przyjmuje się ) korzysta się z tablic statystycznych. Dla dużych prób, używa się przybliżenia rozkładem normalnym, z parametrami podanymi powyżej.

Historia[edytuj]

Twórcą testu był Frank Wilcoxon (18921965), który zaproponował go w jednym artykule (Wilcoxon, 1945) z innym testem, zwanym obecnie testem Manna-Whitneya-Wilcoxona.

Test Wilcoxona był spopularyzowany przez Siegla (1956) w jego wpływowym podręczniku statystyki nieparametrycznej. Siegel używał symbolu dla wielkości oznaczanej powyżej przez . W konsekwencji test czasami jest nazywany testem T Wilcoxona, a statystyka testowa jest podawana jako wartość .

Zobacz też[edytuj]

Bibliografia[edytuj]

  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001, s. 467-471.
  • Sidney Siegel: Non-parametric statistics for the behavioral sciences. Nowy York: McGraw-Hill, 1956.
  • Frank Wilcoxon: Individual comparisons by ranking methods. Biometrics, 1945, s. 1, 80-83.

Linki zewnętrzne[edytuj]

Implementacje[edytuj]