Dystrybuanta

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Dystrybuanta (fr. distribuer „rozdzielać, rozdawać”) – w rachunku prawdopodobieństwa, statystyce i dziedzinach pokrewnych, funkcja rzeczywista jednoznacznie wyznaczająca rozkład prawdopodobieństwa (tj. miarę probabilistyczną określoną na σ-ciele borelowskich podzbiorów prostej[1]), a więc zawierająca wszystkie informacje o tym rozkładzie. Dystrybuanty są efektywnym narzędziem badania prawdopodobieństwa, ponieważ są obiektami prostszymi niż rozkłady prawdopodobieństwa. W statystyce dystrybuanta rozkładu próby zwana jest dystrybuantą empiryczną i jest blisko związana z pojęciem rangi.

Definicja[edytuj | edytuj kod]

Niech \mathbb{P} będzie rozkładem prawdopodobieństwa na prostej. Funkcję F\colon\mathbb R \to \mathbb R daną wzorem

F(t)=\mathbb{P}((-\infty ,t])

nazywamy dystrybuantą rozkładu \mathbb P.

Własności[edytuj | edytuj kod]

Funkcja F\colon \mathbb R \to \mathbb R jest dystrybuantą (pewnego rozkładu prawdopodobieństwa) wtedy i tylko wtedy, gdy jest ona niemalejąca, prawostronnie ciągła oraz

\lim_{t \to -\infty}~F(t) = 0, \quad \lim_{t \to \infty}~F(t) = 1.
Uwaga 1 
Powyższe twierdzenie podaje warunek konieczny i wystarczający na to, by funkcja była dystrybuantą, dlatego czasami to właśnie je przyjmuje się jako definicję. Podejście takie może być korzystniejsze z tego względu, iż nie trzeba odwoływać się do pojęcia rozkładu pochodzącego z teorii miary. Wówczas taka definicja zawiera ciche założenie, że istnieje rozkład, którego ta funkcja jest dystrybuantą.
Uwaga 2 
Dystrybuanta F wyznacza pewien rozkład \mathbb P jednoznacznie i na odwrót, więc gdy zachodzi potrzeba całkowania pewnej funkcji borelowskiej g względem rozkładu \mathbb P, to można mówić, że całkujemy ją względem dystrybuanty F, co zapisuje się:
\int{g}d\mathbb{P}=\int{g}dF
Uwaga 3 
Niekiedy[2] w definicji dystrybuanty stosuje się przedział otwarty:
F(t)=\mathbb{P}((-\infty ,t))
Dystrybuanta jest wówczas funkcją lewostronnie ciągłą (w przeciwieństwie do przypadku gdy w definicji stosuje się przedział prawostronnie domknięty i dystrybuanta jest funkcją prawostronnie ciągłą).

Punkty skokowe[edytuj | edytuj kod]

Punkt skokowy dystrybuanty to punkt xk, dla którego dystrybuanta F(x) spełnia warunek:

F(x_k) - \lim_{x \rightarrow x_{k}^{-}}{F(x)} > 0,

tzn. jest to jej punkt nieciągłości.

W przypadku dyskretnego rozkładu prawdopodobieństwa punkty skokowe występują dla każdej wartości zmiennej losowej, dla której ma ona dodatnie prawdopodobieństwo i tylko tam. W przypadku bezwględnie ciągłego rozkładu prawdopodobieństwa nie ma punktów skokowych dystrybuanty. Zbiór punktów skokowych dystrybuanty jest co najwyżej zbiorem przeliczalnym.

Przykłady[edytuj | edytuj kod]

Wykresy dystrybuant rozkładów normalnych o różnych parametrach.
F(x) = \begin{cases}
0 & \textrm{dla\ } x \leqslant a \\
{{x-a} \over {b-a}} & \textrm{dla\ } a < x \leqslant b \\
1 & \textrm{dla\ } x>b
\end{cases}
F(x) = \int\limits_{-\infty}^x \frac{1} {\sigma\sqrt{2\pi} } e^{-(u-\mu)^2 \over (2\sigma^2)}\,du
F(x) = \begin{cases}
1-e^{-\lambda x}, & x \geqslant 0, \\
0, & x < 0.
\end{cases}

Gęstość[edytuj | edytuj kod]

Mierzalną w sensie Lebesgue'a funkcję f\colon \mathbb{R}\to [0,\infty) nazywamy gęstością dystrybuanty F wtedy i tylko wtedy, gdy dla x\in\mathbb{R}:

F(x)=\int\limits_{-\infty }^{x}{f}(t)dt

Własności[edytuj | edytuj kod]

  • Jeżeli f jest gęstością pewnej dystrybuanty, to całka z f po całej prostej wynosi 1.
  • Jeżeli f_1 i f_2 są gęstościami pewnej dystrybuanty, to są one równe prawie wszędzie.
  • Jeżeli dystrybuanta ma gęstość, to jest funkcją ciągłą.
  • Każda dystrybuanta, jako funkcja monotoniczna jest prawie wszędzie różniczkowalna.
  • Jeśli dystrybuanta F ma gęstość, to dla x\in\mathbb{R}:
F(x)=\int\limits_{-\infty}^x F^\prime(t)dt.

Gęstość dystrybuanty ma praktyczne zastosowanie: jeśli F jest dystrybuantą rozkładu \mathbb P, to często zachodzi konieczność całkowania względem miary \mathbb P. Całkowanie względem abstrakcyjnych miar jest dość trudne (brak konkretnych narzędzi do obliczania całek), jednak jeśli f jest gęstością dystrybuanty F, to

\int\limits_Bg(x)dP(x)=\int\limits_Bg(x)f(x)dx,

dla każdego zbioru borelowskiego B\subseteq \mathbb{R} i dla każdej funkcji borelowskiej g przyjmującej wartości w \mathbb{R}, \overline{\mathbb{R}}, \mathbb{C}, \mathbb{R}^M dla pewnej liczby naturalnej M.

Ciągłość dystrybuanty a istnienie gęstości[edytuj | edytuj kod]

Istnieją ciągłe dystrybuanty nie mające gęstości. Klasycznym przykładem jest:

F(x)=\left\{\begin{array}{l}0,\; x<0\\ C(x),\; x\in [0,1] \\ 1,\; x>1\end{array}\right.,

gdzie C(x) oznacza funkcję Cantora. C(x) jest prawie wszędzie stała, monotoniczna, ciągła i przyjmuje wszystkie wartości z przedziału [0,1]. Dystrybuanta F nie może mieć zatem gęstości ponieważ F^\prime=0 prawie wszędzie.

Funkcja charakterystyczna[edytuj | edytuj kod]

Jeżeli F jest dystrybuantą, to funkcję \varphi\colon \mathbb R \to \mathbb C określoną wzorem

\varphi(t) = \int\limits_{-\infty}^{+\infty}~e^{itx} dF(x)

nazywamy funkcją charakterystyczną dystrybuanty F.

Jeżeli \varphi jest funkcją charakterystyczną pewnej dystrybuanty, to jest ona funkcją jednostajnie ciągłą oraz

  1. \varphi(0) = 1,
  2. \varphi(-t) = \overline{\varphi(t)} dla t \in \mathbb R,
  3. |\varphi(t)| \leqslant 1 dla t \in \mathbb R.

Jednym z praktycznych zastosowań funkcji charakterystycznej jest tzw. wzór na odwrócenie, dokładniej, jeśli \varphi jest funkcją charakterystyczną dystrybuanty F, a x,y są punktami ciągłości tej dystrybuanty, to

F(x)-F(y)=\lim_{a\to\infty}\tfrac{1}{2\pi}\int\limits_{-a}^a\frac{e^{-ity}-e^{-itx}}{it}\varphi(t)dt.

Dowód tego faktu przeprowadza się w oparciu o twierdzenie Fubiniego.

Funkcje charakterystyczne wyznaczają jednoznacznie dystrybuanty, tzn. jeśli dystrybuanty mają te same funkcje charakterystyczne, to są równe. Funkcje charakterystyczne mówią także o własnościach dystrybuanty, związanych z gładkością – dokładniej, jeśli funkcja charakterystyczna jest całkowalna, to dystrybuanta jest klasy C^1.

Zbieżność a ciągłość[edytuj | edytuj kod]

Słaba zbieżność[edytuj | edytuj kod]

Dla ciągów dystrybuant wprowadza się dodatkowy rodzaj zbieżności. Ciąg dystrybuant (F_n)_{n \in \mathbb N} jest słabo zbieżny do dystrybuanty F wtedy i tylko wtedy, gdy

\lim_{n \to \infty}~F_n(x) = F(x)

dla każdego x \in \mathbb R, będącego punktem ciągłości dystrybuanty F.

  • W powyższej definicji istotne jest założenie "do dystrybuanty". Jest tak, ponieważ ciąg dystrybuant może być zbieżny do funkcji, która nie jest dystrybuantą.
Przykład
Niech dany będzie ciąg dystrybuant:
 F_k (x) = 
\left \{ \begin{matrix} 
  0,  & x \leqslant -k \\
  \frac{x + k}{2k}, & -k < x \leqslant k \\
  1, &  x > k 
\end{matrix} \right.
Wówczas dla każdego  x \in \mathbb{R} ,  F_k(x) \xrightarrow[k \to \infty]{} F(x) = \frac{1}{2} , ale funkcja  F(x) = \frac{1}{2} nie jest dystrybuantą.
  • Jeżeli ciąg dystrybuant jest słabo zbieżny do dystrybuanty, to do dokładnie jednej dystrybuanty. Ważnym twierdzeniem dotyczącym słabej zbieżności jest poniższe twierdzenie Helly'ego.

Twierdzenie Helly'ego[edytuj | edytuj kod]

Jeżeli ciąg dystrybuant (F_n)_{n \in \mathbb N} jest słabo zbieżny do dystrybuanty F, a g\colon \mathbb R \to \mathbb R jest ograniczoną funkcją ciągłą, to

\lim_{n \to \infty}~\int\limits_\mathbb R~g(x) dF_n(x) = \int\limits_\mathbb R~g(x) dF(x).

Wnioskiem z twierdzenia Helly'ego jest fakt, że jeśli (F_n)_{n \in \mathbb N} jest ciągiem dystrybuant, a (\varphi_n)_{n \in \mathbb N} ciągiem odpowiadająych im funkcji charakterystycznych oraz (F_n)_{n \in \mathbb N} jest punktowo zbieżny do dystrybuanty F, to ciąg (\varphi_n)_{n \in \mathbb N} jest punktowo zbieżny do funkcji charakterystycznej funkcji F.

Twierdzenie Lévy'ego-Craméra[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: Twierdzenie Lévy'ego-Craméra.

Niech (F_n)_{n \in \mathbb N} będzie ciągiem dystrybuant, a (\varphi_n)_{n \in \mathbb N} będzie ciągiem odpowiadająych im funkcji charakterystycznych. Ciąg (\varphi_n)_{n \in \mathbb N} jest punktowo zbieżny do ciągłej w zerze funkcji \varphi\colon \mathbb R \to \mathbb C wtedy i tylko wtedy, gdy ciąg (F_n)_{n \in \mathbb N} jest słabo zbieżny do pewnej dystrybuanty  F . \varphi jest wówczas funkcją charakterystyczną dystrybuanty  F .

Na mocy powyższego twierdzenia można sformułować wniosek, że ciąg dystrybuant (F_n)_{n \in \mathbb N} jest słabo zbieżny do dystrybuanty F wtedy i tylko wtedy, gdy

\lim_{n \to \infty}~\int\limits_\mathbb R~g(x) dF_n(x) = \int\limits_\mathbb R~g(x) dF(x)

dla każdej ograniczonej funkcji ciągłej g.

Zbieżność jednostajna[edytuj | edytuj kod]

Każdy ciąg dystrybuant zbieżny punktowo do dystrybuanty ciągłej jest zbieżny do niej jednostajnie. Fakt ten można udowodnić korzystając z jednostajnej ciągłości dystrybuanty ciągłej.

Dystrybuanta zmiennej i wektora losowego[edytuj | edytuj kod]

Niech (\Omega, \mathcal A, \mathbb P) będzie ustaloną przestrzenią probabilistyczną.

Jeśli X\colon \Omega \to \mathbb R jest zmienną losową, to funkcja  F_X: \mathbb{R} \to \mathbb{R} dana wzorem:

F_X(x) = \mathbb P(\{\omega \in \Omega\colon\, X(\omega) \leqslant x\})[3] , x \in \mathbb{R}

jest dystrybuantą, którą nazywamy dystrybuantą zmiennej X.

Jeśli X\colon \Omega \to \mathbb R^n jest wektorem losowym, to funkcja  F_X: \mathbb{R}^n \to \mathbb{R} dana wzorem:

 F_X (\mathbf{x}) = \mathbb{P} \left(  X^{-1} ((-\infty, x_1] \times \dots \times (-\infty, x_n]) \right) =
 = \mathbb{P} \left( \bigcap\limits_{k=1}^n \{ \omega \in \Omega \colon X_k(\omega) \leqslant x_k \} \right) , \quad  \mathbf{x} = (x_1, \dots , x_n) \in \mathbb{R}^n

jest dystrybuantą, którą nazywamy dystrybuantą wektora X.

Każda zmienna losowa (wektor losowy) wyznacza pewną dystrybuantę oraz każda dystrybuanta jest dystrybuantą pewnej zmiennej losowej (wektora losowego).

Przypisy

  1. Można także rozważać dystrybuanty rozkładów prawdopodobieństwa w przestrzeni \scriptstyle{\mathbb R^M} dla pewnego \scriptstyle{M \in \mathbb N}
  2. np. w Mieczysław Sobczyk: Statystyka: aspekty praktyczne i teoretyczne. Lublin: Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, 2006, s. 74,75. ISBN 83-227-2423-3.
  3. W praktyce stosuje się zapis \scriptstyle{\mathbb \mathbb P(\{\omega \in \Omega\colon\, X(\omega)\leqslant x\}) = \mathbb P(X(\omega) \leqslant x)} albo nawet \scriptstyle{\mathbb P(X \leqslant x)}.

Bibliografia[edytuj | edytuj kod]

  1. Patrick Billingsley: Prawdopodobieństwo i miara. Warszawa: Państwowe Wydawnictwo Naukowe, 1987.
  2. Jacek Jakubowski, Rafał Sztencel: Wstęp do teorii prawdopodobieństwa. Warszawa: SCRIPT, 2004.
  3. Andrzej Pacut: Prawdopodobieństwo : teoria, modelowanie probabilistyczne w technice. Warszawa: Wydawnictwa Naukowo-Techniczne, 1985, s. 484,485. ISBN 83-204-0524-6.
  4. Jarosław Bartoszewicz: Wykłady ze statystyki matematycznej. Warszawa: Państwowe Wydawnictwo Naukowe, 1989, s. 12. ISBN 83-01-09054-5.