Kryterium Chauveneta

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Kryterium Chauveneta jest heurystycznym warunkiem pozwalającym na stwierdzenie, czy dana obserwacja z próby statystycznej jest tzw. obserwacją odstającą, która powstała na skutek błędu pomiaru. Obserwację taką należy odrzucić przed dalszymi analizami statystycznymi.

Przykład zastosowania[edytuj | edytuj kod]

Wykonując jakiś pomiar powtarzamy go kilka razy, aby otrzymać dokładniejszy wynik. Im więcej pomiarów, tym dokładniejszy wynik. Jednak może się zdarzyć, że przy którejś z kolei próbie coś zakłóciło nam pomiar, przez co znacznie różni się od pozostałych wyników. W takiej sytuacji powstaje pytanie, czy pomiar ten należy brać pod uwagę, czy nie. Aby znaleźć odpowiedź na to pytanie, należy skorzystać z kryterium Chauveneta. (Przy założeniu, że pomiar wielkości x ma rozkład normalny).

Uwagi[edytuj | edytuj kod]

  • Kryterium nie jest dobre przy małej liczności próby N
  • Kryterium nie jest dobre gdy istnieje więcej niż jedna obserwacja odstająca
  • Stosowanie tego kryterium jest słuszne pod warunkiem, że podejrzany wynik jest przejawem jakiegoś błędu, a nie odzwierciedleniem jakiegoś istotnego efektu.

Definicja[edytuj | edytuj kod]

Zakładając, że wyniki pomiarów podlegają rozkładowi normalnemu o wartości oczekiwanej \overline{x} i odchyleniu standardowym \sigma_x, prawdopodobieństwo wystąpienia wyniku o wartości |\overline{x} - x_{pod}| > k\sigma_x wynosi P. Według kryterium Chauveneta iloczyn liczby podejrzanych wyników n i prawdopodobieństwa P musi być mniejszy od 0,5.

n_{pod} = nP < \frac{1}{2}

Objaśnienie[edytuj | edytuj kod]

Załóżmy, że dla pomiarów x_{1}, x_{2}, x_{3}, \dots, x_{n} jeden z nich znacznie różni się od pozostałych (np. x_{9} albo x_{26}). Podejrzany pomiar oznaczmy ogólnie jako x_{pod}.

Następnie należy obliczyć statystykę (liczba odchyleń standardowych) k dla podejrzanej wartości x_{pod} i z tablicy funkcji błędu znaleźć prawdopodobieństwo P wystąpienia wyniku poza k\sigma (niektóre tablice przedstawiają prawdopodobieństwo P wystąpienia wyniku w t\sigma).

k = \frac{|\overline{x} - x_{pod}|}{\sigma_x}

gdzie:

k - liczba odchyleń standardowych, o którą wynik x_{pod} (podejrzany) różni się od wartości średniej \overline{x}
x_{pod} - wartość podejrzana
\overline{x} - średnia arytmetyczna
\sigma_x - odchylenie standardowe (Estymator największej wiarygodności)

jeżeli n_{pod} = nP < \frac{1}{2} to pomiar można odrzucić.

Przykład[edytuj | edytuj kod]

Treść doświadczenia: Długość ściany pewnego budynku została zmierzona 5 razy w wyniku czego otrzymano wyniki:
x_{i}
wartość pomiaru
x_{1}
5,24
x_{2}
5,31
x_{3}
5,40
x_{4}
5,45
x_{5} = x_{pod}
5,93

Piąty pomiar wyraźnie różni się od pozostałych. Powstają wątpliwości, czy wynik ten nie wpłynie negatywnie na ostateczny wynik pomiaru. Dlatego stosując kryterium Chauveneta możemy sprawdzić, czy dany pomiar odrzucić czy trzeba zostawić.

Zadanie: Za pomocą kryterium Chauveneta sprawdzimy, czy pomiar piąty można odrzucić czy nie.

Dane:

N = 5 (liczba wykonanych pomiarów)
x_{pod} = 5,93m
x_{i} - wartość danego pomiaru
k - liczba odchyleń standardowych
n - liczba podejrzanych wyników

Obliczenia:

  1. Obliczamy średnią arytmetyczną:
    \overline{x}=\frac{1}{N} \sum_{i=1}^{N} x_i \Rightarrow \overline{x} =\frac{5,24+5,31+5,40+5,45+5,93}{5} = 5,466 [m]
  2. Obliczamy odchylenie standardowe (Estymator największej wiarygodności):
    \sigma_{x}=\sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_{i}-\overline{x})^2} \Rightarrow \sigma_{x}=0,2717167642969
  3. Obliczamy wyznacznik k:
    k=\frac{|\overline{x} - x_{pod} |}{\sigma_x} \Rightarrow k =1,707660553
  4. Odczytujemy prawdopodobieństwo z tablic: W tym punkcie należy skorzystać z odpowiednich tablic i odczytać konkretną wartość prawdopodobieństwa P [%] dla wartości k obliczonej w poprzednim punkcie.
  5. Obliczenie wyznacznika n_{pod}:
    • n_{pod}= n(1-\frac{P}{100}) - jeżeli tablica przedstawia prawdopodobieństwo P wystąpienia wyniku w k\sigma
    • n_{pod}= nP - jeżeli tablica przedstawia prawdopodobieństwo P wystąpienia wyniku poza k\sigma
  6. Jeżeli n_{pod}<0,5 to sprawdzany pomiar należy odrzucić.

Bibliografia[edytuj | edytuj kod]

  • "Metody opracowania wyników pomiarowych" Politechnika Warszawska, Witold Suchecki
  • "Estymatory średniej i dyspersji" Politechnika Śląska, dr hab. inż. Andrzej Bluszcz

Zobacz też[edytuj | edytuj kod]