Kwantyl

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Kwantyl - jedno z podstawowych pojęć statystyki i rachunku prawdopodobieństwa.

Definicja formalna[edytuj | edytuj kod]

Kwantylem rzędu p, gdzie 0 \leqslant p \leqslant 1, w rozkładzie empirycznym  P_{X} zmiennej losowej X nazywamy taką wartość zmiennej losowej x_{p}, dla której spełnione są nierówności


P_X((-\infty, x_p]) \geqslant p

oraz


P_X([x_p,\infty)) \geqslant 1-p.

W szczególności, kwantylem rzędu p jest taka wartość x_{p} zmiennej losowej, że wartości mniejsze lub równe od x_{p} są przyjmowane z prawdopodobieństwem co najmniej p, zaś wartości większe lub równe od x_{p} są przyjmowane z prawdopodobieństwem co najmniej 1-p.

Nazwy poszczególnych kwantyli[edytuj | edytuj kod]

Kwantyl rzędu 1/2 to inaczej mediana (Ściślej zależy to od definicji mediany, przy jej obliczaniu z próbki o parzystej liczbie elementów często stosuje się średnią arytmetyczną dwóch środkowych elementów, szczegóły są w artykule mediana).
Kwantyle rzędu 1/4, 2/4, 3/4 są inaczej nazywane kwartylami.
Kwantyle rzędu 1/5, 2/5, 3/5, 4/5 to inaczej kwintyle.
Kwantyle rzędu 1/10, 2/10,..., 9/10 to inaczej decyle.
Kwantyle rzędu 1/100, 2/100,..., 99/100 to inaczej percentyle.

Przykład[edytuj | edytuj kod]

Iloraz inteligencji, mierzony według skali Cattela jest zmienną losową o rozkładzie w przybliżeniu normalnym, wartości oczekiwanej równej 100 i odchyleniu standardowym równym 24[1].

Przypuśćmy, że zmierzono inteligencję 20 osób. Wyniki w kolejności rosnącej:
74, 80, 80, 85, 92, 94, 97, 98, 98, 100, 101, 101, 104, 104, 106, 109, 112, 115, 128, 137

Kwantylem rzędu 0.25 (czyli pierwszym kwartylem) jest tutaj liczba 92, gdyż dokładnie pięć próbek (czyli 1/4 z populacji 20 próbek) ma wartość mniejszą lub równą 92. Kwantylem rzędu 0.75 (czyli trzecim kwartylem) jest tu liczba 106.

Pokrewne pojęcia[edytuj | edytuj kod]

Różnica między kwantylem rzędu 3/4 (trzecim kwartylem) a kwantylem rzędu 1/4 (pierwszym kwartylem) zwana jest rozstępem kwartylnym. Jest to miara rozrzutu zmiennej, podobna do odchylenia standardowego, jednak bardziej odporna na elementy odstające.

W statystyce do sprawdzania, czy dana zmienna losowa ma dany rozkład (np. rozkład normalny), używa się tzw. wykresów kwantyl-kwantyl, w których na jednej osi umieszczane są kwantyle rozkładu badanej zmiennej, a na drugiej osi kwantyle porównywanego rozkładu (przy estymowanych jego parametrach). Jeśli zmienna ma idealnie zadany rozkład, wykres ten przedstawia dokładnie prostą. Odchyłki od prostej wskazują na określone typy odchylenia (np. skośny, spłaszczony, itp.). Niektóre testy statystyczne, np. test Shapiro-Wilka oparte są na szacowaniu średniej odległości wykresu kwantyl-kwantyl od prostej.

Przypisy