Test zgodności chi-kwadrat

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Test chi-kwadrat \left (\chi^2\right ) – każdy test statystyczny, w którym statystyka testowa ma rozkład chi kwadrat, jeśli teoretyczna zależność jest prawdziwa. Test chi-kwadrat służy sprawdzaniu hipotez. Innymi słowy wartość testu oceniana jest za pomocą rozkładu chi kwadrat. Test najczęściej wykorzystywany w praktyce. Możemy go wykorzystywać do badania zgodności zarówno cech mierzalnych, jak i niemierzalnych. Jest to jedyny test do badania zgodności cech niemierzalnych.

Test Pearsona[edytuj | edytuj kod]

W ogólności zachodzi:

\chi^2=\sum_{i=1}^n \left ( \frac{O_i-E_i}{\sigma_i} \right )^2,

gdzie:

  • O_i – wartość mierzona,
  • E_i – wartość teoretyczna (oczekiwana) wynikająca z hipotezy odpowiadająca wartości mierzonej,
  • \sigma_iodchylenie standardowe,
  • n – liczba pomiarów.

Zliczenia[edytuj | edytuj kod]

W szczególności, gdy wartościami są zliczenia, wtedy ich odchylenie standardowe wynosi \sqrt{E_i} i równanie przechodzi na:

\chi^2=\sum_{i=1}^n\frac{(O_i{-}E_i)^2}{E_i}.

Uwagi:

  • Przyjmuje się, że wartość E_i powinna być większa lub równa 5 (spotyka się też 10 – nie ma ścisłego wyprowadzenia minimalnej wielkości).
    • Czasem z tego powodu przy pomiarach wartości dyskretnych łączy się te wartości w jeden przedział (patrz przykład).
  • Przy pomiarze wartości ciągłej wartość teoretyczna to całka z rozkładu prawdopodobieństwa po odpowiednim przedziale z którego zliczane były wyniki.
Przykład

Rozpatrzmy rzut pięcioma kośćmi, i liczbę wyrzuconych szóstek k. Może ona przyjmować wartości 0,1,2,3,4,5, nie widać więc potrzeby dzielenia tych wielkości na przedziały. Rzut został powtórzony 200 razy, wartości teoretyczne dla takiej ilości rzutów przedstawione są w tabeli, w kolumnie E_k. Widać że dla k=4,5 są to wartości bardzo małe, dlatego też należy stworzyć nowe przedziały, tak aby w każdym wartość teoretyczna była większa od 5. Przedstawione jest to w tabeli, oznaczone są one przez n

k E_k n E_n
0 80,4 0 80,4
1 80,4 1 80,4
2 32,2 2 32,2
3 6,4 3 7,0
4 0,6
5 0,03

Mając dane z rzutów można obliczyć ich zgodność z rozkładem teoretycznym (tutaj jest to rozkład dwumianowy b_{5,\frac{1}{6}}(k)). W praktyce byłby to test kości na to jak dobrze jest wyważona.

Sprawdzanie zależności dwu mierzonych wartości[edytuj | edytuj kod]

Mając dwie serie pomiarów x_i i y_i, a także teoretyczną zależność y=f(x), można określić dzięki testowi chi-kwadrat na ile ta zależność pasuje do danych doświadczalnych. Przyjmując, że wartość błędu x jest zaniedbywalna i \sigma_i jako błąd wartości y_i.

\chi^2=\sum_{i=1}^n\left(\frac{y_i-f(x_i)}{\sigma_i}\right)^2

Normalizacja[edytuj | edytuj kod]

Wartość zredukowanego testu chi-kwadrat wynosi

\widehat{\chi^2}=\frac{1}{d}\chi^2

d=n-c-1  –  liczba stopni swobody,

gdzie c to liczba parametrów modelu teoretycznego szacowanych na podstawie danych pomiarowych. Może to być np. średnia, dyspersja, parametr funkcji f (x) czy całkowita ilość pomiarów. Można udowodnić, że nieznormalizowany test chi-kwadrat ma oczekiwaną wartość d, zatem test unormowany powinien wynosić 1. Widać także, że liczba pomiarów powinna być większa od liczby szacowanych parametrów. Okazuje się, że za pomocą testu chi-kwadrat można potwierdzić każdą teorię o dostatecznie dużej liczbie parametrów.

W poprzednim przykładzie, aby obliczyć wartość oczekiwaną należy pomnożyć rozkład przez ilość rzutów, przyjąć c = 0 (nie szacujemy żadnych parametrów modelu); wtedy d = 4  0  1 = 3 .

Interpretacja[edytuj | edytuj kod]

Otrzymaną wartość znormalizowanego testu ocenia się za pomocą rozkładu chi kwadrat. Polega to na obliczeniu prawdopodobieństwa otrzymania wartości testu równej lub większej, niż otrzymanej przez nas. Ponieważ takie obliczenia są dość skomplikowane, najczęściej korzysta się z danych zamieszczonych w odpowiednich tablicach.

Mając odpowiednie prawdopodobieństwo, należy określić jego najmniejszą wartość, dla której jesteśmy w stanie zaakceptować hipotezę jako prawdę. Przyjmuje się te wartości różnie. Okazuje się, że zbyt duże prawdopodobieństwo także świadczy o złym wyniku (lub o wyniku nieuczciwym). Wynika to z faktu, że dane podlegają pewnemu rozkładowi, więc bardzo mało prawdopodobne jest, aby wszystkie otrzymane wyniki tak dobrze pasowały do modelu teoretycznego.

Zastosowania[edytuj | edytuj kod]

Test \chi^2 jest najważniejszym testem nieparametrycznym. Znajduje zastosowania w rachunku błędu pomiarowego w naukach przyrodniczych, technicznych i naukach społecznych.

Bibliografia[edytuj | edytuj kod]

  • John R. Taylor, Wstęp do analizy błędu pomiarowego.

Linki zewnętrzne[edytuj | edytuj kod]