Dystrybuanta

Dystrybuanta (fr. distribuer „rozdzielać, rozdawać” z łac. distribuo zob. dystrybucja) – funkcja rzeczywista jednoznacznie wyznaczająca rozkład prawdopodobieństwa (tj. miarę probabilistyczną określoną na σ-ciele borelowskich podzbiorów prostej^[1]), a więc zawierająca wszystkie informacje o tym rozkładzie. Dystrybuanty są efektywnym narzędziem badania prawdopodobieństwa, ponieważ są obiektami prostszymi niż rozkłady prawdopodobieństwa. W statystyce dystrybuanta rozkładu próby zwana jest dystrybuantą empiryczną i jest blisko związana z pojęciem rangi.

Definicja formalna[edytuj | edytuj kod]

Niech $\mathbb {P}$ będzie rozkładem prawdopodobieństwa na prostej. Funkcję $F\colon \mathbb {R} \to \mathbb {R}$ daną wzorem

F(t)=\mathbb {P} ((-\infty ,t]),

nazywamy dystrybuantą rozkładu $\mathbb {P} .$

Własności[edytuj | edytuj kod]

Funkcja $F\colon \mathbb {R} \to \mathbb {R}$ jest dystrybuantą (pewnego rozkładu prawdopodobieństwa) wtedy i tylko wtedy, gdy jest ona niemalejąca, prawostronnie ciągła oraz

$\lim _{t\to -\infty }~F(t)=0,$
$\lim _{t\to \infty }~F(t)=1.$

Uwaga 1: Powyższa charakteryzacja dostarcza warunek konieczny i wystarczający na to, by funkcja dana funkcja $F\colon \mathbb {R} \to \mathbb {R}$ była dystrybuantą pewnego rozkładu, dlatego czasami to właśnie je przyjmuje się jako definicję. Podejście takie może być korzystniejsze z tego względu, że nie trzeba odwoływać się do pojęcia rozkładu pochodzącego z teorii miary. Wówczas taka definicja zawiera ciche założenie, że istnieje rozkład, którego ta funkcja jest dystrybuantą.

Uwaga 2

Dystrybuanta

F

wyznacza pewien rozkład

\mathbb {P}

jednoznacznie i na odwrót, więc gdy zachodzi potrzeba całkowania pewnej funkcji borelowskiej

g

względem rozkładu

\mathbb {P} ,

to można mówić, że całkujemy ją względem dystrybuanty

F,

co zapisuje się:

\int {g}\,\mathrm {d} \mathbb {P} =\int {g}\,\mathrm {d} F.

Uwaga 3

Niekiedy^[2] w definicji dystrybuanty stosuje się przedział otwarty:

F(t)=\mathbb {P} ((-\infty ,t)).

Dystrybuanta jest wówczas funkcją lewostronnie ciągłą (w przeciwieństwie do przypadku gdy w definicji stosuje się przedział prawostronnie domknięty i dystrybuanta jest funkcją prawostronnie ciągłą).

Punkty skokowe[edytuj | edytuj kod]

Punkt skokowy dystrybuanty to punkt $y,$ dla którego dystrybuanta $F(x)$ spełnia warunek:

F(y)-\lim _{x\to y^{-}}{F(x)}>0,

tzn. jest to jej punkt nieciągłości.

W przypadku dyskretnego rozkładu prawdopodobieństwa punkty skokowe występują dla każdej wartości zmiennej losowej, dla której ma ona dodatnie prawdopodobieństwo i tylko tam. W przypadku bezwzględnie ciągłego rozkładu prawdopodobieństwa nie ma punktów skokowych dystrybuanty. Zbiór punktów skokowych dystrybuanty jest co najwyżej zbiorem przeliczalnym.

Przykłady[edytuj | edytuj kod]

Dystrybuanta rozkładu jednostajnego na przedziale $[a,b]{:}$

F(x)={\begin{cases}0&{\textrm {dla}}\ \ x\leqslant a\\[2pt]{\frac {x-a}{b-a}}&{\textrm {dla}}\ \ a<x\leqslant b\\[2pt]1&{\textrm {dla}}\ \ x>b\end{cases}}

Dystrybuanta rozkładu normalnego o parametrach $\mu$ i $\sigma ^{2}{:}$

F(x)=\int \limits _{-\infty }^{x}{\frac {1}{\sigma {\sqrt {2\pi }}}}e^{\frac {-(t-\mu )^{2}}{(2\sigma ^{2})}}\,\mathrm {d} t

Dystrybuanta rozkładu wykładniczego o parametrze $\lambda {:}$

F(x)={\begin{cases}1-e^{-\lambda x},&x\geqslant 0,\\[2pt]0,&x<0.\end{cases}}

Gęstość[edytuj | edytuj kod]

Osobny artykuł: funkcja gęstości prawdopodobieństwa.

Mierzalną w sensie Lebesgue’a funkcję $f\colon \mathbb {R} \to [0,\infty )$ nazywamy gęstością dystrybuanty $F$ wtedy i tylko wtedy, gdy:

F(x)=\int \limits _{-\infty }^{x}{f}(t)\,\mathrm {d} t\quad (x\in \mathbb {R} ).

Własności[edytuj | edytuj kod]

Jeżeli $f$ jest gęstością pewnej dystrybuanty, to całka z $f$ po całej prostej wynosi $1.$
Jeżeli $f_{1}$ i $f_{2}$ są gęstościami pewnej dystrybuanty, to są one równe prawie wszędzie.
Jeżeli dystrybuanta ma gęstość, to jest funkcją ciągłą.
Każda dystrybuanta, jako funkcja monotoniczna jest prawie wszędzie różniczkowalna.
Jeśli dystrybuanta $F$ ma gęstość, to dla $x\in \mathbb {R} {:}$

F(x)=\int \limits _{-\infty }^{x}F'(t)\,\mathrm {d} t.

Gęstość dystrybuanty ma praktyczne zastosowanie: jeśli $F$ jest dystrybuantą rozkładu $\mathbb {P} ,$ to często zachodzi konieczność całkowania względem miary $\mathbb {P} .$ Całkowanie względem abstrakcyjnych miar jest dość trudne (brak konkretnych narzędzi do obliczania całek), jednak jeśli $f$ jest gęstością dystrybuanty $F,$ to

\int \limits _{B}g(x)\,\mathrm {d} \mathbb {P} (x)=\int \limits _{B}g(x)f(x)\,\mathrm {d} x,

dla każdego zbioru borelowskiego $B\subseteq \mathbb {R}$ i dla każdej funkcji borelowskiej $g$ przyjmującej wartości w $\mathbb {R} ,{\overline {\mathbb {R} }},\mathbb {C} ,\mathbb {R} ^{M}$ dla pewnej liczby naturalnej $M.$

Ciągłość dystrybuanty a istnienie gęstości[edytuj | edytuj kod]

Istnieją ciągłe dystrybuanty niemające gęstości. Klasycznym przykładem jest:

F(x)=\left\{{\begin{array}{l}0,&x<0\\C(x),&x\in [0,1],\\1,&x>1,\end{array}}\right.

gdzie $C(x)$ oznacza funkcję Cantora. $C(x)$ jest prawie wszędzie stała, monotoniczna, ciągła i przyjmuje wszystkie wartości z przedziału $[0,1].$ Dystrybuanta $F$ nie może mieć zatem gęstości ponieważ $F'=0$ prawie wszędzie.

Funkcja charakterystyczna[edytuj | edytuj kod]

Osobny artykuł: Funkcja charakterystyczna (teoria prawdopodobieństwa).

Jeżeli $F$ jest dystrybuantą, to funkcję $\varphi \colon \mathbb {R} \to \mathbb {C}$ określoną wzorem

\varphi (t)=\int \limits _{-\infty }^{+\infty }~e^{itx}dF(x)

nazywamy funkcją charakterystyczną dystrybuanty $F.$

Jeżeli $\varphi$ jest funkcją charakterystyczną pewnej dystrybuanty, to jest ona funkcją jednostajnie ciągłą oraz

$\varphi (0)=1,$
$\varphi (-t)={\overline {\varphi (t)}}$ dla $t\in \mathbb {R} ,$
$|\varphi (t)|\leqslant 1$ dla $t\in \mathbb {R} .$

Jednym z praktycznych zastosowań funkcji charakterystycznej jest tzw. wzór na odwrócenie, dokładniej, jeśli $\varphi$ jest funkcją charakterystyczną dystrybuanty $F,$ a $x,y$ są punktami ciągłości tej dystrybuanty, to

F(x)-F(y)=\lim _{a\to \infty }{\tfrac {1}{2\pi }}\int \limits _{-a}^{a}{\frac {e^{-ity}-e^{-itx}}{it}}\varphi (t)dt.

Dowód tego faktu przeprowadza się w oparciu o twierdzenie Fubiniego.

Funkcje charakterystyczne wyznaczają jednoznacznie dystrybuanty, tzn. jeśli dystrybuanty mają te same funkcje charakterystyczne, to są równe. Funkcje charakterystyczne mówią także o własnościach dystrybuanty, związanych z gładkością – dokładniej, jeśli funkcja charakterystyczna jest całkowalna, to dystrybuanta jest klasy $C^{1}.$

Zbieżność a ciągłość[edytuj | edytuj kod]

Słaba zbieżność[edytuj | edytuj kod]

Dla ciągów dystrybuant wprowadza się dodatkowy rodzaj zbieżności. Ciąg dystrybuant $(F_{n})_{n\in \mathbb {N} }$ jest słabo zbieżny do dystrybuanty $F$ wtedy i tylko wtedy, gdy

\lim _{n\to \infty }~F_{n}(x)=F(x)

dla każdego $x\in \mathbb {R} ,$ będącego punktem ciągłości dystrybuanty $F.$

W powyższej definicji istotne jest założenie „do dystrybuanty”. Jest tak, ponieważ ciąg dystrybuant może być zbieżny do funkcji, która nie jest dystrybuantą.

Przykład

Niech dany będzie ciąg dystrybuant:

F_{k}(x)={\begin{cases}0,&x\leqslant -k\\[2pt]{\frac {x+k}{2k}},&-k<x\leqslant k\\[2pt]1,&x>k\end{cases}}

Wówczas dla każdego

x\in \mathbb {R} ,

F_{k}(x){\xrightarrow[{k\to \infty }]{}}F(x)={\frac {1}{2}},

ale funkcja

F(x)={\frac {1}{2}}

nie jest dystrybuantą.

Jeżeli ciąg dystrybuant jest słabo zbieżny do dystrybuanty, to do dokładnie jednej dystrybuanty. Ważnym twierdzeniem dotyczącym słabej zbieżności jest poniższe twierdzenie Helly’ego.

Twierdzenie Helly’ego[edytuj | edytuj kod]

Jeżeli ciąg dystrybuant $(F_{n})_{n\in \mathbb {N} }$ jest słabo zbieżny do dystrybuanty $F,$ a $g\colon \mathbb {R} \to \mathbb {R}$ jest ograniczoną funkcją ciągłą, to

\lim _{n\to \infty }~\int \limits _{\mathbb {R} }~g(x)dF_{n}(x)=\int \limits _{\mathbb {R} }~g(x)dF(x).

Wnioskiem z twierdzenia Helly’ego jest fakt, że jeśli $(F_{n})_{n\in \mathbb {N} }$ jest ciągiem dystrybuant, a $(\varphi _{n})_{n\in \mathbb {N} }$ ciągiem odpowiadająych im funkcji charakterystycznych oraz $(F_{n})_{n\in \mathbb {N} }$ jest punktowo zbieżny do dystrybuanty $F,$ to ciąg $(\varphi _{n})_{n\in \mathbb {N} }$ jest punktowo zbieżny do funkcji charakterystycznej funkcji $F.$

Twierdzenie Lévy’ego-Craméra[edytuj | edytuj kod]

Osobny artykuł: Twierdzenie Lévy’ego-Craméra.

Niech $(F_{n})_{n\in \mathbb {N} }$ będzie ciągiem dystrybuant, a $(\varphi _{n})_{n\in \mathbb {N} }$ będzie ciągiem odpowiadających im funkcji charakterystycznych. Ciąg $(\varphi _{n})_{n\in \mathbb {N} }$ jest punktowo zbieżny do ciągłej w zerze funkcji $\varphi \colon \mathbb {R} \to \mathbb {C}$ wtedy i tylko wtedy, gdy ciąg $(F_{n})_{n\in \mathbb {N} }$ jest słabo zbieżny do pewnej dystrybuanty $F.$ $\varphi$ jest wówczas funkcją charakterystyczną dystrybuanty $F.$

Na mocy powyższego twierdzenia można sformułować wniosek, że ciąg dystrybuant $(F_{n})_{n\in \mathbb {N} }$ jest słabo zbieżny do dystrybuanty $F$ wtedy i tylko wtedy, gdy

\lim _{n\to \infty }~\int \limits _{\mathbb {R} }~g(x)dF_{n}(x)=\int \limits _{\mathbb {R} }~g(x)dF(x)

dla każdej ograniczonej funkcji ciągłej $g.$

Zbieżność jednostajna[edytuj | edytuj kod]

Każdy ciąg dystrybuant zbieżny punktowo do dystrybuanty ciągłej jest zbieżny do niej jednostajnie. Fakt ten można udowodnić, korzystając z jednostajnej ciągłości dystrybuanty ciągłej.

Dystrybuanta zmiennej i wektora losowego[edytuj | edytuj kod]

Niech $(\Omega ,{\mathcal {A}},\mathbb {P} )$ będzie ustaloną przestrzenią probabilistyczną.

Jeśli $X\colon \Omega \to \mathbb {R}$ jest zmienną losową, to funkcja $F_{X}\colon \mathbb {R} \to \mathbb {R}$ dana wzorem:

F_{X}(x)=\mathbb {P} (\{\omega \in \Omega \colon \,X(\omega )\leqslant x\})

^[3],

x\in \mathbb {R}

jest dystrybuantą, którą nazywamy dystrybuantą zmiennej $X.$

{\begin{aligned}F_{X}(\mathbf {x} )&=\mathbb {P} \left(X^{-1}((-\infty ,x_{1}]\times \ldots \times (-\infty ,x_{n}])\right)\\&=\mathbb {P} \left(\bigcap \limits _{k=1}^{n}\{\omega \in \Omega \colon X_{k}(\omega )\leqslant x_{k}\}\right),\quad \mathbf {x} =(x_{1},\dots ,x_{n})\in \mathbb {R} ^{n}\end{aligned}}

jest dystrybuantą, którą nazywamy dystrybuantą wektora $X.$

Każda zmienna losowa (wektor losowy) wyznacza pewną dystrybuantę oraz każda dystrybuanta jest dystrybuantą pewnej zmiennej losowej (wektora losowego).

Przypisy[edytuj | edytuj kod]

↑ Można także rozważać dystrybuanty rozkładów prawdopodobieństwa w przestrzeni $\mathbb {R} ^{M}$ dla pewnego $M\in \mathbb {N} .$
↑ Mieczysław Sobczyk: Statystyka: aspekty praktyczne i teoretyczne. Lublin: Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, 2006, s. 74, 75. ISBN 83-227-2423-3.
↑ W praktyce stosuje się zapis $\mathbb {\mathbb {P} } (\{\omega \in \Omega \colon \,X(\omega )\leqslant x\})=\mathbb {P} (X(\omega )\leqslant x)$ albo nawet $\mathbb {P} (X\leqslant x).$

Bibliografia[edytuj | edytuj kod]

Patrick Billingsley: Prawdopodobieństwo i miara. Warszawa: Państwowe Wydawnictwo Naukowe, 1987.
Jacek Jakubowski, Rafał Sztencel: Wstęp do teorii prawdopodobieństwa. Warszawa: SCRIPT, 2004.
Andrzej Pacut: Prawdopodobieństwo. Teoria, modelowanie probabilistyczne w technice. Warszawa: Wydawnictwa Naukowo-Techniczne, 1985, s. 484, 485. ISBN 83-204-0524-6.
Jarosław Bartoszewicz: Wykłady ze statystyki matematycznej. Warszawa: Państwowe Wydawnictwo Naukowe, 1989, s. 12. ISBN 83-01-09054-5.

[1] Można także rozważać dystrybuanty rozkładów prawdopodobieństwa w przestrzeni $\mathbb {R} ^{M}$ dla pewnego $M\in \mathbb {N} .$

[2] Mieczysław Sobczyk: Statystyka: aspekty praktyczne i teoretyczne. Lublin: Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, 2006, s. 74, 75. ISBN 83-227-2423-3.

[3] W praktyce stosuje się zapis $\mathbb {\mathbb {P} } (\{\omega \in \Omega \colon \,X(\omega )\leqslant x\})=\mathbb {P} (X(\omega )\leqslant x)$ albo nawet $\mathbb {P} (X\leqslant x).$

[1]

[2]

[3]