Test Kołmogorowa-Smirnowa
Test Kołmogorowa-Smirnowa – test nieparametryczny używany do porównywania rozkładów jednowymiarowych cech statystycznych. Istnieją dwie główne wersje tego testu – dla jednej próby i dla dwóch prób.
Test dla jednej próby (zwany też testem zgodności λ Kołmogorowa) sprawdza, czy rozkład w populacji dla pewnej zmiennej losowej, różni się od założonego rozkładu teoretycznego, gdy znana jest jedynie pewna skończona liczba obserwacji tej zmiennej (próba statystyczna). Często wykorzystywany jest on w celu sprawdzenia, czy zmienna ma rozkład normalny. Dla celów testowania normalności zostały dokonane w teście drobne usprawnienia, znane jako test Lillieforsa.
Istnieje też wersja testu dla dwóch prób, pozwalająca na porównanie rozkładów dwóch zmiennych losowych. Jego zaletą jest wrażliwość zarówno na różnice w położeniu, jak i w kształcie dystrybuanty empirycznej porównywanych próbek.
Statystyka Kołmogorowa-Smirnowa[edytuj | edytuj kod]
Dystrybuanta empiryczna dla n-elementowej próby jest zdefiniowana jako funkcja:
gdzie:
- to wartość zmiennej dla -tej obserwacji.
- to funkcja charakterystyczna (tu: przyjmująca wartość jeden gdy i zero w przeciwnym wypadku).
Statystyka Kołmogorowa-Smirnowa dla danej dystrybuanty teoretycznej jest dana wzorem:
Na mocy twierdzenia Gliwenki-Cantellego, jeśli próba pochodzi z rozkładu o dystrybuancie to dąży prawie wszędzie do zera. Kołmogorow wzmocnił ten wynik stwarzając efektywną metodę oceny tej zbieżności (zobacz niżej). Twierdzenie Donskera dostarcza jednak jeszcze silniejszego wyniku.
Rozkład Kołmogorowa[edytuj | edytuj kod]
Rozkład Kołmogorowa to rozkład zmiennej losowej
gdzie jest mostem Browna. Dystrybuanta jest dana przez
Test dla jednej próby[edytuj | edytuj kod]
W warunkach hipotezy zerowej, gdy próba pochodzi z rozkładu teoretycznego wówczas:
(zbieżność według rozkładu), gdzie jest mostem Browna.
Jeśli jest ciągła, wówczas w warunkach hipotezy zerowej dąży do rozkładu Kołmogorowa, niezależnie od Ten wynik znany jest też jako twierdzenie Kołmogorowa.
Test Kołmogorowa-Smirnowa jest konstruowany z użyciem obszaru krytycznego rozkładu Kołmogorowa.
Hipoteza zerowa jest odrzucana na poziomie jeśli
gdzie jest dane przez:
Asymptotyczna moc tego testu wynosi 1. Jeśli forma lub parametry są wyznaczane z nierówność może nie być prawdziwa. W tym przypadku konieczne jest zastosowanie metody Monte Carlo lub innych algorytmów.
Bardziej znaną formą tego testu jest:
Test dla dwóch prób[edytuj | edytuj kod]
Test Kołmogorowa-Smirnowa może być także użyty do sprawdzenia, czy dwa jednowymiarowe rozkłady prawdopodobieństwa różnią się od siebie. W takim przypadku statystyką Kołmogorowa-Smirnowa jest:
a hipoteza zerowa jest odrzucana na poziomie gdy
Przedział ufności dla kształtu dystrybuanty[edytuj | edytuj kod]
Chociaż test Kołmogorowa-Smirnowa jest zwykle używany do sprawdzania, czy dana dystrybuanta teoretyczna opisuje rozkład populacji, z której wylosowano próbę o dystrybuancie empirycznej jednak procedura może być odwrócona w celu uzyskania przedziału ufności dla samej funkcji Wybierając wartość krytyczną dla statystyki testowej taką, że uzyskujemy pas o promieniu wokół który całkowicie zawiera z prawdopodobieństwem
Zobacz też[edytuj | edytuj kod]
- Andriej Kołmogorow
- statystyka nieparametryczna
- test Andersona-Darlinga
- test Jarque-Bera
- test Kuipera
- test Lillieforsa
- test Shapiro-Wilka
Bibliografia[edytuj | edytuj kod]
- W.T. Eadie, D. Drijard, F.E. James, M. Roos, B. Sadoulet: Statistical Methods in Experimental Physics. Amsterdam: North-Holland, 1971, s. 269–271.
- Alan Stuart, Keith Ord, Steven Arnold: Kendall’s Advanced Theory of Statistics. T. 2A. London: Arnold, a member of the Hodder Headline Group, 1999, s. 25.37–25.43.
Linki zewnętrzne[edytuj | edytuj kod]
- Krótkie wprowadzenie (ang.)
- Wyjaśnienie testu K-S (ang.)
- Implementacja testów dla jednej i dwóch prób w JavaScripcie (ang.)
- Kalkulator online z testem K-S (ang.)