Test Manna-Whitneya-Wilcoxona

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Test Manna-Whitneya-Wilcoxona (zwany również testem Manna–Whitneya lub czasem testem sumy rang Wilcoxona dla dwu próbek, albo po prostu testem Wilcoxona dla dwóch próbek) – semi-nieparametryczny test do sprawdzenia czy wartości próbek pobranych z dwóch niezależnych populacji są jednakowo duże. Jest jednym z najbardziej popularnych nieparametrycznych testów znamienności. Zaproponowany pierwotnie jako test przesunięcia dla dwóch równolicznych próbek przez Franka Wilcoxona w 1945, uogólniony następnie przez H. B. Manna i D. R. Whitneya (1947) dla przypadku różnolicznych próbek oraz do testowania równości stochastycznej.

Założenia i sformułowanie hipotezy[edytuj | edytuj kod]

W ogólnym przypadku zakłada się, że:

1. wszystkie obserwacje, dla obydwu grup, są niezależne statystycznie,

2. zmienne X i Y mierzone są na skali porządkowej, a więc dla dowolnej pary obserwacji, można określić ich uporządkowanie: stwierdzić ich równość lub wskazać na większą spośród nich.

3. testowaną hipotezą zerową jest symetria względem prawdopodobieństwa większej wartości jednej ze zmiennych, a więc hipoteza zerowa zakłada jednakowe prawdopodobieństwo X > Y i Y > X: P(X > Y)=P(Y > X).

4. hipotezą alternatywną jest asymetria względem prawdopodobieństwa większej wartości jednej ze zmiennych, a więc w wersji dwustronnej testu, że prawdopodobieństwo X > Y jest różne od prawdopodobieństwa Y > X (w wersji jednostronnej, hipotezą alternatywną jest P(X > Y) > P(Y > X) lub P(X > Y) < P(Y > X)).

Test Manna-Whitneya w ogólnej wersji, sformułowanej powyżej, ma słabe założenia i może być stosowany w bardzo szerokim zakresie. W literaturze jednak często zdarza się, że hipotezy zerowa i alternatywna formułowane są w sposób mniej ogólny, stosowalność testu Manna-Whitneya do testowania tych hipotez jest wówczas ograniczona. Tak więc czasem zakłada się, że według hipotezy zerowej obydwie zmienne X i Y mają identyczny rozkład, a według hipotezy alternatywnej ich rozkłady są jednakowe z wyjątkiem przesunięcia o stałą δ (tzn. F1(x) = F2(x + δ)). Taka interpretacja testu Manna-Whitneya nazywa się czasem testowaniem przesunięcia. W praktyce zwykle zmienne różnić się mogą nie tylko pod względem przesunięcia ale i innych parametrów np. wariancji, wówczas stosowalność tak interpretowanego testu Manna-Whitneya jest wątpliwa, a test może mieć małą moc dla odrzucenia hipotezy zerowej. Np. test nie jest w stanie odrzucić hipotezy zerowej o identyczności rozkładów gdy X i Y są zmiennymi normalnymi o tej samej średniej ale różnych wariancjach.

Innym dodatkowym założeniem dodawanym czasem gwoli wygody obliczeniowej jest brak obserwacji związanych: tzn. zerowe prawdopodobieństwo otrzymania dwu obserwacji o jednakowej wartości. Jednak założenie braku obserwacji związanych nie jest konieczne, test Manna-Whitneya stosować można w obecności obserwacji związanych używając poprawek obliczeniowych na obserwacje związane lub przeprowadzając obliczenia przy pomocy testu permutacji.

Kolejnym, często pomijanym założeniem jest statystyczna równość wartości parametrów skali (dyspersji, wariancji) obu prób.

Obliczenia[edytuj | edytuj kod]

Test wymaga obliczenia statystyki, zwykle oznaczonej U, której rozkład jest znany w przypadku hipotezy zerowej. W przypadku małych próbek, rozkład statystyki U jest tabularyzowany, ale dla próbek powyżej  ~20 obserwacji znane są dobre przybliżenia oparte na rozkładzie normalnym. Czasem w miejsce statystyki U używa się równoważnej statystyki, np. sumy rang jednej z próbek.

Statystyka U określa liczbę wszystkich par obserwacji (x,y) (x jest obserwacją z pierwszej próbki, y jest obserwacją z drugiej próbki) takich, że x > y. W wypadku obecności obserwacji związanych do U dodaje się również połowę liczby par (x,y) takich że x=y.

Zagadnienie nieparametryczności testu[edytuj | edytuj kod]

Test Manna-Whitneya-Wilcoxona nie jest w pełni testem nieparametrycznym. Często pomijanym założeniem jest założenie o równości wartości parametru skali (dyspersji) w obu próbach. Tylko wówczas, gdy założenie to jest spełnione, można przyjąć, że decyzja o odrzuceniu hipotezy zerowej lub braku takiej możliwości, zależy wyłącznie od przesunięcia. W przeciwnym razie może się okazać, iż dwie próby, różniące się znacznie dyspersją (wariancją), ale mające identyczne wartości parametru przesunięcia (mediany) zostaną zakwalifikowane jako pochodzące z tej samej populacji, choć np. słabszy test Kołmogorowa-Smirnowa a także intuicja sugerowałyby, że tak nie jest. Do sprawdzenia statystycznej równości wartości parametrów skali dwóch prób służy np. test Ansariego-Bradleya.

Bibliografia[edytuj | edytuj kod]

  • Corder, G.W. & Foreman, D.I. (2009). Nonparametric Statistics for Non-Statisticians: A Step-by-Step Approach.
  • Conover, W. J. (1980). Practical Nonparametric Statistics (3rd Ed.)
  • Herrnstein, R. J., Loveland, D. H., & Cable, C. (1976). Natural concepts in pigeons. Journal of Experimental Psychology: Animal Behavior Processes, 2, 285–302.
  • Hollander, M. and Wolfe, D. A. (1999). Nonparametric Statistical Methods (2nd Ed.).
  • Lehmann, E. L. (1975). NONPARAMETRICS: Statistical Methods Based On Ranks.
  • Mann, H. B., & Whitney, D. R. (1947). "On a test of whether one of two random variables is stochastically larger than the other". Annals of Mathematical Statistics, 18, 50–60 (pdf).
  • Wilcoxon, F. (1945). "Individual comparisons by ranking methods". Biometrics Bulletin, 1, 80–83.

Linki zewnętrzne[edytuj | edytuj kod]

  • Tabela krytycznych wartości U (pdf)