Dystrybuanta

Z Wikipedii

Skocz do: nawigacji, szukaj

Dystrybuanta – w rachunku prawdopodobieństwa, statystyce i dziedzinach pokrewnych, funkcja rzeczywista jednoznacznie wyznaczająca rozkład prawdopodobieństwa (tj. miarę probabilistyczną określoną na σ-ciele borelowskich podzbiorów prostej[1]), a więc zawierająca wszystkie informacje o tym rozkładzie. Dystrybuanty są efektywnym narzędziem badania prawdopodobieństwa ponieważ, są obiektem prostszym niż rozkłady prawdopodobieństwa. Dystrybuanta rozkładu próby zwana jest dystrybuantą empiryczną. Jest ona blisko związana z pojęciem rangi.

Spis treści

[edytuj] Definicja

Niech \mathbb{P} będzie rozkładem prawdopodobieństwa na prostej. Funkcję F\colon\mathbb R \to \mathbb R daną wzorem

F(t)=\mathbb{P}((-\infty ,t])

nazywamy dystrybuantą rozkładu \mathbb P.

[edytuj] Własności

Funkcja F\colon \mathbb R \to \mathbb R jest dystrybuantą wtedy i tylko wtedy, gdy jest ona niemalejąca, prawostronnie ciągła oraz

\lim_{t \to -\infty}~F(t) = 0, \quad \lim_{t \to \infty}~F(t) = 1.
Uwaga 1 
Powyższe twierdzenie podaje warunek konieczny i wystarczający na to, by funkcja była dystrybuantą, dlatego czasami to właśnie je przyjmuje się jako definicję. Podejście takie może być korzystniejsze z tego względu, iż nie trzeba odwoływać się do pojęcia rozkładu pochodzącego z teorii miary. Wówczas taka definicja zawiera ciche założenie, że istnieje rozkład, którego ta funkcja jest dystrybuantą.
Uwaga 2 
Dystrybanta F wyznacza pewien rozkład \mathbb P jednoznacznie i na odwrót, więc gdy zachodzi potrzeba całkowania pewnej funkcji borelowskiej g względem rozkładu \mathbb P, to można mówić, że całkujemy ją względem dystrybuanty F, co zapisuje się:
\int{g}d\mathbb{P}=\int{g}dF

[edytuj] Przykłady

Wykresy dystrybuant rozkładów normalnych o różnych parametrach.
F(x) = \begin{cases}
0 & \textrm{dla\ } x \leqslant a \\
{{x-a} \over {b-a}} & \textrm{dla\ } a < x \leqslant b \\
1 & \textrm{dla\ } x>b
\end{cases}
F(x) = \int\limits_{-\infty}^x \frac{1} {\sigma\sqrt{2\pi} } e^{-(u-\mu)^2 \over (2\sigma^2)}\,du
F(x) = \begin{cases}
1-e^{-\lambda x}, & x \geqslant 0, \\
0, & x < 0.
\end{cases}

[edytuj] Gęstość

 Osobny artykuł: gęstość prawdopodobieństwa.

Mierzalną w sensie Lebesgue'a funkcję f\colon \mathbb{R}\to [0,\infty) nazywamy gęstością dystrybuanty F wtedy i tylko wtedy, gdy dla x\in\mathbb{R}:

F(x)=\int\limits_{-\infty }^{x}{f}(t)dt

[edytuj] Własności

  • Jeżeli f jest gęstością pewnej dystrybuanty, to całka z f po całej prostej wynosi 1.
  • Jeżeli f1 i f2 są gęstościami pewnej dystrybuanty, to są one równe prawie wszędzie.
  • Jeżeli dystrybuanta ma gęstość, to jest funkcją ciągłą.
  • Każda dystrybuanta, jako funkcja monotoniczna jest prawie wszędzie różniczkowalna.
  • Jeśli dystrybuanta F ma gęstość, to dla x\in\mathbb{R}:
F(x)=\int\limits_{-\infty}^x F^\prime(t)dt.

Gęstość dystrybuanty ma praktyczne zastosowanie: jeśli F jest dystrybuantą rozkładu \mathbb P, to często zachodzi konieczność całkowania względem miary \mathbb P. Całkowanie względem abstrakcyjnych miar jest dość trudne (brak konkretnych narzędzi do obliczania całek), jednak jeśli f jest gęstością dystrybuanty F, to

\int\limits_Bg(x)dP(x)=\int\limits_Bg(x)f(x)dx,

dla każdego zbioru borelowskiego B\subseteq \mathbb{R} i dla każdej funkcji borelowskiej g przyjmującej wartości w \mathbb{R}, \overline{\mathbb{R}}, \mathbb{C}, \mathbb{R}^M dla pewnej liczby naturalnej M.

[edytuj] Ciągłość dystrybuanty a istnienie gęstości

Istnieją ciągłe dystrybuanty nie mające gęstości. Klasycznym przykładem jest:

F(x)=\left\{\begin{array}{l}0,\; x<0\\ C(x),\; x\in [0,1] \\ 1,\; x>1\end{array}\right.,

gdzie C(x) oznacza funkcję Cantora. C(x) jest prawie wszędzie stała, monotoniczna, ciągła i przyjmuje wszystkie wartości z przedziału [0,1]. Dystrybuanta F nie może mieć zatem gęstości ponieważ F^\prime=0 prawie wszędzie.

[edytuj] Funkcja charakterystyczna

 Osobny artykuł: funkcja charakterystyczna.

Jeżeli F jest dystrybuantą, to funkcję \varphi\colon \mathbb R \to \mathbb C określoną wzorem

\varphi(t) = \int\limits_{-\infty}^{+\infty}~e^{itx} dF(x)

nazywamy funkcją charakterystyczną dystrybuanty F.

Jeżeli \varphi jest funkcją charakterystyczną pewnej dystrybuanty, to jest ona funkcją jednostajnie ciągłą oraz

  1. \varphi(0) = 1,
  2. \varphi(-t) = \overline{\varphi(t)} dla t \in \mathbb R,
  3. |\varphi(t)| \leqslant 1 dla t \in \mathbb R.

Jednym z praktycznych zastosowań funkcji charakterystycznej jest tzw. wzór na odwrócenie, dokładniej, jeśli \varphi jest funkcją charakterystyczną dystrybuanty F, a x,y są punktami ciągłości tej dystrybuanty, to

F(x)-F(y)=\lim_{a\to\infty}\tfrac{1}{2\pi}\int\limits_{-a}^a\frac{e^{-ity}-e^{-itx}}{it}\varphi(t)dt.

Dowód tego faktu przeprowadza się w oparciu o twierdzenie Fubiniego.

Funkcje charakterystyczne wyznaczają jednoznacznie dystrybuanty, tzn. jeśli dystrybuanty mają te same funkcje charakterystyczne, to są równe. Funkcje charakterystyczne mówią także o własnościach dystrybuanty, związanych z gładkością – dokładniej, jeśli funkcja charakterystyczna jest całkowalna, to dystrybuanta jest klasy C1.

[edytuj] Zbieżność a ciągłość

[edytuj] Słaba zbieżność

Dla ciągów dystrybuant wprowadza się dodatkowy rodzaj zbieżności. Ciąg dystrybuant (F_n)_{n \in \mathbb N} jest słabo zbieżny do dystrybuanty F wtedy i tylko wtedy, gdy

\lim_{n \to \infty}~F_n(x) = F(x)

dla każdego x \in \mathbb R, będącego punktem ciągłości dystrybuanty F.

  • W powyższej definicji istotne jest założenie "do dystrybuanty". Jest tak, ponieważ ciąg dystrybuant może być zbieżny do funkcji, która nie jest dystrybuantą.
Przykład
Niech dany będzie ciąg dystrybuant:
 F_k (x) = 
\left \{ \begin{matrix} 
  0,  & x \leqslant -k \\
  \frac{x + k}{2k}, & -k < x \leqslant k \\
  1, &  x > k 
\end{matrix} \right.
Wówczas dla każdego  x \in \mathbb{R} ,  F_k(x) \xrightarrow[k \to \infty]{} F(x) = \frac{1}{2} , ale funkcja  F(x) = \frac{1}{2} nie jest dystrybuantą.
  • Jeżeli ciąg dystrybuant jest słabo zbieżny do dystrybuanty, to do dokładnie jednej dystrybuanty. Ważnym twierdzeniem dotyczącym słabej zbieżności jest poniższe twierdzenie Helly'ego.

[edytuj] Twierdzenie Helly'ego

Jeżeli ciąg dystrybuant (F_n)_{n \in \mathbb N} jest słabo zbieżny do dystrybuanty F, a g\colon \mathbb R \to \mathbb R jest ograniczoną funkcją ciągłą, to

\lim_{n \to \infty}~\int\limits_\mathbb R~g(x) dF_n(x) = \int\limits_\mathbb R~g(x) dF(x).

Wnioskiem z twierdzenia Helly'ego jest fakt, że jeśli (F_n)_{n \in \mathbb N} jest ciągiem dystrybuant, a (\varphi_n)_{n \in \mathbb N} ciągiem odpowiadająych im funkcji charakterystycznych oraz (F_n)_{n \in \mathbb N} jest punktowo zbieżny do dystrybuanty F, to ciąg (\varphi_n)_{n \in \mathbb N} jest punktowo zbieżny do funkcji charakterystycznej funkcji F.

[edytuj] Twierdzenie Lévy'ego-Craméra

 Osobny artykuł: Twierdzenie Lévy'ego-Craméra.

Niech (F_n)_{n \in \mathbb N} będzie ciągiem dystrybuant, a (\varphi_n)_{n \in \mathbb N} będzie ciągiem odpowiadająych im funkcji charakterystycznych. Ciąg (\varphi_n)_{n \in \mathbb N} jest punktowo zbieżny do ciągłej w zerze funkcji \varphi\colon \mathbb R \to \mathbb C wtedy i tylko wtedy, gdy ciąg (F_n)_{n \in \mathbb N} jest słabo zbieżny do pewnej dystrybuanty F. \varphi jest wówczas funkcją charakterystyczną dystrybuanty F.

Na mocy powyższego twierdzenia można sformułować wniosek, że ciąg dystrybuant (F_n)_{n \in \mathbb N} jest słabo zbieżny do dystrybuanty F wtedy i tylko wtedy, gdy

\lim_{n \to \infty}~\int\limits_\mathbb R~g(x) dF_n(x) = \int\limits_\mathbb R~g(x) dF(x)

dla każdej ograniczonej funkcji ciągłej g.

[edytuj] Zbieżność jednostajna

Każdy ciąg dystrybuant zbieżny punktowo do dystrybuanty ciągłej jest zbieżny do niej jednostajnie. Fakt ten można udowodnić korzystając z jednostajnej ciągłości dystrybuanty ciągłej.

[edytuj] Dystrybuanta zmiennej i wektora losowego

Niech (\Omega, \mathcal A, \mathbb P) będzie ustaloną przestrzenią probabilistyczną.

Jeśli X\colon \Omega \to \mathbb R jest zmienną losową, to funkcja  F_X: \mathbb{R} \to \mathbb{R} dana wzorem:

F_X(x) = \mathbb P(\{\omega \in \Omega\colon\, X(\omega) \leqslant x\})[2] , x \in \mathbb{R}

jest dystrybuantą, którą nazywamy dystrybuantą zmiennej X.

Jeśli X\colon \Omega \to \mathbb R^n jest wektorem losowym, to funkcja  F_X: \mathbb{R}^n \to \mathbb{R} dana wzorem:

 F_X (\mathbf{x}) = \mathbb{P} \left(  X^{-1} ((-\infty, x_1] \times \dots \times (-\infty, x_n]) \right) =
 = \mathbb{P} \left( \bigcap\limits_{k=1}^n \{ \omega \in \Omega \colon X_k(\omega) \leqslant x_k \} \right) , \quad  \mathbf{x} = (x_1, \dots , x_n) \in \mathbb{R}^n

jest dystrybuantą, którą nazywamy dystrybuantą wektora X.

Każda zmienna losowa (wektor losowy) wyznacza pewną dystrybuantę oraz każda dystrybuanta jest dystrybuantą pewnej zmiennej losowej (wektora losowego).

Przypisy

  1. Można także rozważać dystrybuanty rozkładów prawdopodobieństwa w przestrzeni \scriptstyle{\mathbb R^M} dla pewnego \scriptstyle{M \in \mathbb N}
  2. W praktyce stosuje się zapis \scriptstyle{\mathbb \mathbb P(\{\omega \in \Omega\colon\, X(\omega)\leqslant x\}) = \mathbb P(X(\omega) \leqslant x)} albo nawet \scriptstyle{\mathbb P(X \leqslant x)}.

[edytuj] Bibliografia

  1. Patrick Billingsley: Prawdopodobieństwo i miara. Warszawa: Państwowe Wydawnictwo Naukowe, 1987. 
  2. Jacek Jakubowski, Rafał Sztencel: Wstęp do teorii prawdopodobieństwa. Warszawa: SCRIPT, 2004. 
  3. Andrzej Pacut: Prawdopodobieństwo : teoria, modelowanie probabilistyczne w technice. Warszawa: Wydawnictwa Naukowo-Techniczne, 1985, ss. 484,485. ISBN 83-204-0524-6. 
  4. Jarosław Bartoszewicz: Wykłady ze statystyki matematycznej. Warszawa: Państwowe Wydawnictwo Naukowe, 1989, s. 12. ISBN 83-01-09054-5. 
Utwórz książkę