Rozkład Studenta

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania
Rozkład t-Studenta
Gęstość prawdopodobieństwa
Student densite best.JPG
Dystrybuanta
T distributionCDF.png
Parametry \nu > 0 stopni swobody (liczba rzeczywista)
Nośnik x \in (-\infty; +\infty)\!
Gęstość prawdopodobieństwa \frac{\Gamma(\frac{\nu+1}{2})} {\sqrt{\nu\pi}\,\Gamma(\frac{\nu}{2})} \left(1+\frac{x^2}{\nu} \right)^{-(\frac{\nu+1}{2})}\!
Dystrybuanta \begin{matrix}
     \frac{1}{2} + x \Gamma \left( \frac{\nu+1}{2} \right)  \cdot\\[0.5em]
     \frac{\,_2F_1 \left ( \frac{1}{2},\frac{\nu+1}{2};\frac{3}{2};
           -\frac{x^2}{\nu} \right)}
     {\sqrt{\pi\nu}\,\Gamma (\frac{\nu}{2})}
     \end{matrix}
gdzie _2F_1 \,jest funkcją hipergeometryczną
Wartość oczekiwana (średnia) 0\text{ dla }\nu>1, w przeciwnym wypadku nieokreślona
Mediana 0
Moda 0
Wariancja \frac{\nu}{\nu-2}\text{ dla }\nu>2\!, w przeciwnym wypadku nieokreślona
Współczynnik skośności 0\text{ dla }\nu>3
Kurtoza \frac{6}{\nu-4}\text{ dla }\nu>4\!
Entropia \begin{matrix}
         \frac{\nu+1}{2}\left[ 
             \psi(\frac{1+\nu}{2}) 
               - \psi(\frac{\nu}{2})
         \right] \\[0.5em]
+ \log{\left[\sqrt{\nu}B(\frac{\nu}{2},\frac{1}{2})\right]}
\end{matrix}
Funkcja generująca momenty (nieokreślona)
Funkcja charakterystyczna
Odkrywca William Sealy Gosset (1908)

Rozkład Studenta – (rozkład t lub rozkład t-Studenta) ciągły rozkład prawdopodobieństwa stosowany często w statystyce w procedurach testowania hipotez statystycznych i przy ocenie błędów pomiaru. Przy opracowaniu wyników pomiarów często powstaje zagadnienie oszacowania przedziału, w którym leży, z określonym prawdopodobieństwem, rzeczywista wartość mierzona, jeśli dysponujemy tylko wynikami n pomiarów, dla których możemy wyznaczyć takie parametry, jak średnia \overline{X} i odchylenie standardowe s\! lub wariancja s^{2}\! („z próby”), nie znamy natomiast odchylenia standardowego \sigma\! w populacji. Zagadnienie to rozwiązał (w 1908 r.) W. S. Gosset (pseudonim Student) podając funkcję zależną od wyników pomiarów X_{i}, a niezależną od \sigma\!.

Definicja[edytuj | edytuj kod]

Rozkład Studenta z \nu \, stopniami swobody jest rozkładem zmiennej losowej  t \, postaci:

 t=\frac{U}{\sqrt{Z}}\sqrt{\nu}

gdzie:

Gęstość prawdopodobieństwa[edytuj | edytuj kod]

Zmienna losowa  t \, określona powyżej ma gęstość prawdopodobieństwa opisaną wzorem:


f(t,\nu) = \frac{\Gamma(\frac{\nu+1}{2})}{\Gamma(\frac{\nu}{2})\sqrt{\nu\pi}}\left(1+\frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}}

gdzie \Gamma(x) \, to funkcja gamma.

Własności[edytuj | edytuj kod]

Powyższy wzór określa całą rodzinę rozkładów prawdopodobieństwa zależną od parametru  \nu \, – liczby stopni swobody rozkładu Studenta. Rozkłady te są symetryczne, jednomodalne, dla dużych wartości  \nu \, zmierzają do standardowego rozkładu normalnego N(0,1). Dla małych  \nu \, różnią się jednak od rozkładu normalnego: rozkład Studenta o  \nu \, stopniach swobody ma skończone momenty tylko do rzędu  \nu - 1 , w szczególności dla  \nu = 1 rozkład Studenta jest identyczny z rozkładem Cauchy'ego i nie posiada żadnych skończonych momentów (nie istnieje nawet wartość średnia).

Własności te ilustruje poniższy wykres przedstawiający gęstości rozkładu Studenta dla kilku wartości liczby stopni swobody \nu w zestawieniu z gęstością standardowego rozkładu normalnego N(0,1). rozkłady Studenta porównane z rozkładem normalnym

Zastosowania[edytuj | edytuj kod]

Zastosowania rozkładu Studenta w metrologii i statystyce opierają się w większości na następujących dwóch twierdzeniach:

  1. Niech zmienne losowe  X_{1}, X_{2}, ... ,X_{n} \, mają jednakowy rozkład prawdopodobieństwa, który jest rozkładem normalnym o średniej  m \, i wariancji \sigma^{2} \, oraz niech zmienna  t \, będzie określona wzorem:
    t=\frac{\overline{X}-m}{s}\cdot\sqrt{n}
    gdzie \overline{X} jest wartością średnią z próby, zaś s \, - odchyleniem standardowym z próby.
    Wówczas zmienna  t \, ma rozkład t-Studenta o \nu = n-1 stopniach swobody (niezależny od wartości wariancji w populacji \sigma^{2}).
  2. Jeżeli dwie próby o liczebnościach n_{1} oraz n_{2}, wartościach średnich \overline{X}_{1} oraz \overline{X}_{2} i wariancjach wyznaczonych z próby s_{1}^{2} oraz s_{2}^{2} zostały wylosowane z populacji mających taki sam rozkład normalny, to zmienna t określona wzorem:
    t=\frac{\overline{X}_{1}-\overline{X}_{2}}{\sqrt{n_{1}s_{1}^{2}+n_{2}s_{2}^{2}}}\sqrt{\frac{n_{1}n_{2}}
{n_{1}+n_{2}}(n_{1}+n_{2}-2)}
    ma rozkład t-Studenta o \nu = n_{1}+n_{2}-2 stopniach swobody.

Rozkład t jest stosowany w estymacji przedziałowej, w testach parametrycznych, w szczególności dla wartości średnich i dla wariancji oraz w testach istotności parametrów statystycznych - gdy mamy do czynienia z próbami małymi (najczęściej arbitralnie przyjmuje się, że próba jest mała gdy jej liczebność n\leqslant30).

W metrologii rozkład Studenta wykorzystywany jest m.in. przy estymacji odchylenia standardowego (dla pojedynczego pomiaru oraz wartości oczekiwanej). Dla dużych prób (n > 30) praktycznie pokrywa się z rozkładem normalnym, dla mniejszych estymator odchylenia należy pomnożyć przez wartość krytyczną rozkładu Studenta dla liczby stopni swobody \nu = n-1 i przyjętego poziomu istotności \alpha\!.

Najczęściej potrzebne są w zastosowaniach kwantyle rozkładu Studenta, to znaczy takie wartości t_{\alpha} \,, że P(t>t_{\alpha})=\alpha \, lub P(|t|<t_{\alpha})=\alpha . \, Wartości te podają tablice rozkładu t-Studenta.

Zobacz też[edytuj | edytuj kod]


Bibliografia[edytuj | edytuj kod]

Tablice statystyczne[edytuj | edytuj kod]

  • Zieliński R.,’’Tablice statystyczne’’, PWN, Warszawa, 1972

Linki zewnętrzne[edytuj | edytuj kod]