Test Kołmogorowa-Smirnowa

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Test Kołmogorowa-Smirnowatest nieparametryczny używany do porównywania rozkładów jednowymiarowych cech statystycznych. Istnieją dwie główne wersje tego testu – dla jednej próby i dla dwóch prób.

Test dla jednej próby (zwany też testem zgodności λ Kołmogorowa) sprawdza, czy rozkład w populacji dla pewnej zmiennej losowej, różni się od założonego rozkładu teoretycznego, gdy znana jest jedynie pewna skończona liczba obserwacji tej zmiennej (próba statystyczna). Często wykorzystywany jest on w celu sprawdzenia, czy zmienna ma rozkład normalny. Dla celów testowania normalności zostały dokonane w teście drobne usprawnienia, znane jako test Lillieforsa.

Istnieje też wersja testu dla dwóch prób, pozwalająca na porównanie rozkładów dwóch zmiennych losowych. Jego zaletą jest wrażliwość zarówno na różnice w położeniu, jak i w kształcie dystrybuanty empirycznej porównywanych próbek.

Statystyka Kołmogorowa-Smirnowa[edytuj]

Dystrybuanta empiryczna dla n-elementowej próby jest zdefiniowana jako funkcja:

gdzie:

  • to wartość zmiennej dla -tej obserwacji.
  • to funkcja charakterystyczna (tu: przyjmująca wartość jeden gdy i zero w przeciwnym wypadku).

Statystyka Kołmogorowa-Smirnowa dla danej dystrybuanty teoretycznej jest dana wzorem:

Na mocy twierdzenia Gliwenki-Cantellego, jeśli próba pochodzi z rozkładu o dystrybuancie , to dąży prawie wszędzie do zera. Kołmogorow wzmocnił ten wynik stwarzając efektywną metodę oceny tej zbieżności (zobacz niżej). Twierdzenie Donskera dostarcza jednak jeszcze silniejszego wyniku.

Rozkład Kołmogorowa[edytuj]

Rozkład Kołmogorowa to rozkład zmiennej losowej

gdzie jest mostem Browna. Dystrybuanta jest dana przez

Test dla jednej próby[edytuj]

W warunkach hipotezy zerowej, gdy próba pochodzi z rozkładu teoretycznego , wówczas:

(zbieżność według rozkładu), gdzie jest mostem Browna.

Jeśli jest ciągła, wówczas w warunkach hipotezy zerowej dąży do rozkładu Kołmogorowa, niezależnie od . Ten wynik znany jest też jako twierdzenie Kołmogorowa.

Test Kołmogorowa-Smirnowa jest konstruowany z użyciem obszaru krytycznego rozkładu Kołmogorowa.

Hipoteza zerowa jest odrzucana na poziomie , jeśli

gdzie jest dane przez:

Asymptotyczna moc tego testu wynosi 1. Jeśli forma lub parametry są wyznaczane z , nierówność może nie być prawdziwa. W tym przypadku konieczne jest zastosowanie metody Monte Carlo lub innych algorytmów.

Bardziej znaną formą tego testu jest:

Test dla dwóch prób[edytuj]

Test Kołmogorowa-Smirnowa może być także użyty do sprawdzenia, czy dwa jednowymiarowe rozkłady prawdopodobieństwa różnią się od siebie. W takim przypadku statystyką Kołmogorowa-Smirnowa jest:

a hipoteza zerowa jest odrzucana na poziomie , gdy

Przedział ufności dla kształtu dystrybuanty[edytuj]

Chociaż test Kołmogorowa-Smirnowa jest zwykle używany do sprawdzania, czy dana dystrybuanta teoretyczna opisuje rozkład populacji, z której wylosowano próbę o dystrybuancie empirycznej , jednak procedura może być odwrócona w celu uzyskania przedziału ufności dla samej funkcji . Wybierając wartość krytyczną dla statystyki testowej taką, że , uzyskujemy pas o promieniu wokół , który całkowicie zawiera z prawdopodobieństwem .

Zobacz też[edytuj]

Bibliografia[edytuj]

  • W.T. Eadie, D. Drijard, F.E. James, M. Roos, B. Sadoulet: Statistical Methods in Experimental Physics. Amsterdam: North-Holland, 1971, s. 269-271.
  • Alan Stuart, Keith Ord, Steven Arnold: Kendall's Advanced Theory of Statistics. T. 2A. London: Arnold, a member of the Hodder Headline Group, 1999, s. 25.37-25.43.

Linki zewnętrzne[edytuj]