Test serii

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Test serii — zwany też testem serii Stevensa lub testem serii Walda-Wolfowitza — jest jednym z nieparametrycznych testów losowości próby. Stosujemy go m. in., gdy chcemy sprawdzić, czy wyniki eksperymentu spełniają postulat losowości próby.

Hipotezę zerową i alternatywną formułujemy w sposób następujący:

  • H0: dobór jednostek do próby jest losowy; model jest liniowy.
  • H1: dobór jednostek do próby nie jest losowy; model jest nieliniowy.


Jedną z metod weryfikacji wyżej zapisanej hipotezy jest test serii.

Pod pojęciem serii rozumiemy każdy ciąg identycznych elementów w zbiorze uporządkowanym według przyjętego kryterium. Na przykład, jeżeli odnotujemy płeć studentów podchodzących kolejno do egzaminu, możemy otrzymać ciąg:

M M Ż Ż M Ż Ż Ż M M Ż M Ż Ż Ż.

W tym przykładowym ciągu, uporządkowanym według kolejności pojawiania się elementów dwóch rodzajów (M i Ż), powstało 8 serii składających się z jednakowych elementów występujących obok siebie. Zakładając, że pojawienie się kolejnych elementów jest losowe, ogólna liczba serii w ciągu n-elementowym jest zmienną losową K o znanym i ujętym w tablice rozkładzie. Jest ona statystyką w opisywanym teście losowości próby.

Sposób wyznaczania wartości statystyki z próby:

  1. Kolejno zapisane n obserwacji zmiennej ciągłej tworzy ciąg podstawowy;
  2. Obserwacje porządkujemy rosnąco i wyznaczamy medianę;
  3. W ciągu podstawowym oznaczamy symbolami A i B wartości różniące się od mediany:
    • xi<Me oznaczamy A;
    • xi>Me oznaczamy B;
    • xi=Me pomijamy.
  4. Analizując ustawienie symboli A i B, zliczamy utworzoną liczbę serii k, która jest wartością statystyki otrzymaną z próby;

Obszar krytyczny testu jest dwustronny.

Jeżeli nA,nB ≤ 20, to wartości krytyczne odczytujemy z tablic rozkładu liczby serii (tablica H) jako:

k1/2;nA;nB)     oraz     k2(1-α/2;nA;nB),
gdzie nA i nB oznaczają odpowiednio liczbę elementów oznaczonych symbolami A i B.

Zliczoną w próbie liczbę serii k porównujemy z wartościami krytycznymi testu.

Jeżeli wystąpi k≤ k1 lub k≥ k2, odrzucamy H0 na rzecz H1, co będzie oznaczało, że próba nie ma charakteru losowego.

Jeżeli nA i nB ≥ 20, to zmienna losowa K dąży asymptotycznie do rozkładu normalnego N{E(K),D(K)}. Wartość średnia i wariancja zmiennej są określone wzorami:

\mathbb{E}(K)=\frac{2n_{A}n_{B}}{n}+1\;
D^2(K)=\frac{2n_{A}n_{B}(2n_{A}n_{B}-n)}{(n-1)n^2}\;

Wykorzystując te parametry, obliczamy statystykę Z, która przy założeniu prawdziwości H_{0} ma rozkład N(0,1).

Z=\frac{K - E(K)}{D(K)}\;

Zobacz też[edytuj | edytuj kod]