Rozkład prawdopodobieństwa
Rozkład prawdopodobieństwa – w najczęstszej interpretacji (rozkład zmiennej losowej) miara probabilistyczna określona na sigma-ciele podzbiorów zbioru wartości zmiennej losowej (wektora losowego), pozwalająca przypisywać prawdopodobieństwa zbiorom wartości tej zmiennej, odpowiadającym zdarzeniom losowym. Formalnie rozkład prawdopodobieństwa może być jednak rozpatrywany także bez stosowania zmiennych losowych.
Spis treści |
Definicja [edytuj]
Rozkładem prawdopodobieństwa nazywa się dowolną miarę probabilistyczną
określoną na σ-ciele podzbiorów borelowskich pewnej przestrzeni polskiej. Dla rozkładów ciągłych często jest nią zbiór liczb rzeczywistych
(tzw. rozkład jednowymiarowy) lub przestrzeń euklidesowa
dla pewnej liczby naturalnej
(rozkład wielowymiarowy).
Zastosowanie dla zmiennych losowych [edytuj]
Zwykle rozważa się tzw. przestrzeń probabilistyczną, złożoną z przestrzeni zdarzeń elementarnych
, określonego na niej σ-ciała
, którego elementy są nazywane zdarzeniami losowymi, oraz miary probabilistycznej
, przyporządkowującej zdarzeniom liczby zwane prawdopodobieństwami. Tak określone prawdopodobieństwa są jednak niewygodne do badania, gdyż
może być dowolnym zbiorem, nawet bez zadanych jakichkolwiek relacji między jego elementami.
Wprowadza się zatem funkcję mierzalną zwaną zmienną losową, która przyporządkowuje elementom przestrzeni zdarzeń elementarnych
elementy pewnej przestrzeni mierzalnej
o pożądanych właściwościach[1]. Najczęściej wykorzystuje się przestrzeń euklidesową
a zmienną nazywa się wówczas wektorem losowym. Czasem miano zmiennej losowej rezerwuje się tylko dla przypadku jednowymiarowego
.
Obrazem każdego zdarzenia losowego (elementu rodziny
) poprzez zmienną losową
jest mierzalny podzbiór
. Mierzalne podzbiory
tworzą także σ-ciało
. Ponieważ zmienna losowa nie musi być funkcją różnowartościową, więc ten sam zbiór mierzalny
można w ogólnym przypadku otrzymać z wielu różnych zdarzeń o różnych prawdopodobieństwach. Aksjomaty σ-ciała zapewniają, że wśród tych zdarzeń jest także ich suma i do niej jest przypisane największe prawdopodobieństwo. Suma ta jest równa przeciwobrazowi zbioru
, czyli
.
Rozkład zmiennej losowej
to funkcja
określona na
wzorem
.
Rozkład
jest nową miarą probabilistyczną. Jest on w przestrzeni stanów
odpowiednikiem miary probabilistycznej
.
Uwaga: Zapis
gdzie
jest zdarzeniem a nie zmienną losową jest stosowany na oznaczenie prawdopodobieństwa warunkowego.
Wyróżnia się niżej omówione rozkłady ciągłe i dyskretne, jednak należy pamiętać, iż oprócz nich istnieją także rozkłady nie mieszczące się w żadnej z tych kategorii – na przykład rozkład o dystrybuancie Cantora.
Rozkład ciągły [edytuj]
Jeżeli istnieje funkcja
, taka że
(całka Lebesgue'a) dla dowolnego zbioru borelowskiego
, to funkcję tę nazywa się gęstością (rozkładu) prawdopodobieństwa lub funkcją gęstości prawdopodobieństwa. Nazwa pochodzi od intuicji fizycznych, zob. gęstość masy. O rozkładzie
mającym gęstość mówi się, że jest ciągły (lub typu ciągłego).
Powyższa definicja jest poprawna dla dowolnych rozkładów prawdopodobieństwa, także wielowymiarowych – wówczas
jest wektorem.
Rozkład
zmiennej losowej
spełniający powyższe warunki definiuje się analogicznie. O zmiennej losowej również mówi się wówczas, iż jest ciągła (lub typu ciągłego).
Rozkład dyskretny [edytuj]
Rozkład
nazywa się dyskretnym, jeśli jest skupiony na zbiorze przeliczalnym, tzn. istnieje zbiór (co najwyżej) przeliczalny
dla którego
. Jeżeli
oraz
dla każdego
,
to dla dowolnego zbioru borelowskiego 
,
gdzie
to indykator (funkcja charakterystyczna) zbioru
.
Zatem zbiór par
jednoznacznie wyznacza rozkład
. Stąd dowolny zbiór tej postaci, gdzie
oraz
(co wynika z własności rozkładu), nazywa się czasami rozkładem (dyskretnym). Odwzorowanie
, oznaczane
, nosi nazwę funkcji masy prawdopodobieństwa i jest ono dyskretnym odpowiednikiem gęstości prawdopodobieństwa.
Dyskretna zmienna losowa
to zmienna losowa o rozkładzie dyskretnym. Wówczas można go zdefiniować podobnie jak wyżej równością
,
jednakże w tym wypadku zachodzi dodatkowo
,
gdzie
jest zbiorem wszystkich wartości przyjmowanych przez zmienną
.
Dystrybuanta [edytuj]
Badanie rozkładu jako miary jest zadaniem dość trudnym, jednak można je znacząco uprościć wprowadzając funkcję dystrybuanty, która całkowicie go opisuje i jest funkcją przestrzeni euklidesowej w przedział
.
Dystrybuanta rozkładu jednowymiarowego [edytuj]
Dystrybuanta jednowymiarowego rozkładu (prawdopodobieństwa)
to funkcja
, zdefiniowana wzorem:
.
Dystrybuanta (rozkładu) zmiennej losowej
, to dystrybuanta
, oznaczana zwykle symbolem
, otrzymana z rozkładu tej zmiennej losowej:
Dystrybuanta w pełni wyznacza rozkład, tzn. dwie zmienne o tej samej dystrybuancie muszą mieć ten sam rozkład; obrazuje to poniższy przykład.
Jeśli rozkład
ma gęstość
, jego dystrubuanta
wyraża się wzorem:
.
Przykład [edytuj]
Niech
będzie modelem doświadczenia losowego polegającego na rzucie monetą, które może z jednakowym prawdopodobieństwem dać dwa wyniki: orła i reszkę. Stąd
oraz
.
Jeżeli zmienna
jest określona równościami
oraz
,
to jej rozkład
jest określony następująco:
,
funkcja masy prawdopodobieństwa ma z kolei postać:
,
co oznacza, że zmienna losowa
odwzorowuje zdarzenia
,
oraz zachowuje prawdopodobieństwo określone na
przekształcając je w rozkład określony na
.
Niech
będzie modelem opisującym jak wyżej rzut monetą poszerzone o dodatkowy wynik: upadek na kant, który prawie na pewno się nie zdarzy. Jeżeli
oraz
,
to zmienna losowa
określona równościami
oraz
,
będzie miała taki sam rozkład
(oraz funkcję masy) co zmienna
określona wyżej, mimo iż są one różne.
Z definicji dystrybuanty wynika, iż prawdopodobieństwo zdarzenia
dane jest wzorem
.
Dystrybuanta zmiennej
to funkcja
określona wzorem
Warto zauważyć, iż dystrybuanta
zmiennej
dana jest tym samym wzorem co dystrybuanta
.
Dystrybuanta rozkładu wielowymiarowego [edytuj]
Jeśli
jest wektorem losowym, tzn.
, to zmienia się nieco postać dystrybuanty. Rozważa się wówczas przedziały wielowymiarowe, tzn. zbiory będące iloczynami kartezjańskimi przedziałów prostej postaci
;
dystrybuanta
takiego zdarzenia zapisywana jest zwykle jako
.
Stosuje się następujący zapis dystrybuanty rozkładu zmiennej losowej:
,
gdzie
. Jeżeli przyjmie się
, to zapis
nie prowadzi zwykle do większych nieporozumień.
Jeśli rozkład wielowymiarowy
ma gęstość
, jego dystrybuanta
wyraża się wzorem (całka Lebesgue'a):
.
Zwykle wzór ten spotyka się w prostszej wersji, choć o mniejszym zakresie stosowalności (nie każdą całkę Lebesgue'a da się w ten sposób rozbić):
Dodatkowe definicje [edytuj]
Zmienna losowa
ma rozkład osobliwy (singularny), jeśli ma ciągłą dystrybuantę i istnieje zbiór
, który ma zerową miarę Lebesgue'a, ale jednostkowy rozkład (miarę) prawdopodobieństwa, tzn.
oraz 
Rozkłady skoncentrowane na zbiorze punktów postaci
, gdzie
nazywa się arytmetycznymi. To, iż rozkład
jest skupiony na zbiorze
jest równoważne temu, iż jego funkcja charakterystyczna
ma okres równy
bądź
dla pewnego
. Z obserwacji funkcji charakterystycznych wynika, iż arytmetyczne są rozkłady: geometryczny, Bernoulliego i Poissona; rozkłady jedno- i dwupunktowe są przesuniętymi rozkładami tego typu.
Popularne rozkłady [edytuj]
Rozkłady ciągłe [edytuj]
ƒN(x) – rozkład normalny,
ƒE(x) – rozkład wykładniczy,
ƒR(x) – rozkład jednostajny,
ƒT(x) – rozkład trójkątny,
ƒD(x)– rozkład delty Diraca dla zmiennej pewnej.
- rozkład beta,
- rozkład χ²,
- rozkład Cauchy'ego,
- rozkład Erlanga,
- rozkład F Snedecora,
- rozkład gamma,
- Rozkład Fishera-Tippetta,
- rozkład Weibulla,
- rozkład jednostajny ciągły (prostokątny),
- rozkład Laplace'a,
- rozkład Leviego,
- rozkład logarytmicznie normalny,
- rozkład normalny (Gaussa),
- wielowymiarowy rozkład normalny,
- rozkład trójkątny,
- rozkład Studenta,
- rozkład wykładniczy.
Rozkłady dyskretne [edytuj]
- rozkład Boltzmanna,
- rozkład dwupunktowy (Bernoulliego u anglojęzycznych autorów),
- rozkład dwumianowy (Bernoulliego u większości polskich autorów),
- rozkład jednopunktowy (typu delta Diraca),
- rozkład jednostajny dyskretny,
- rozkład geometryczny,
- rozkład hipergeometryczny,
- rozkład Poissona,
- rozkład zero-jedynkowy,
- rozkład ujemny dwumianowy (Pascala).
Statystyka [edytuj]
Jeśli mamy na myśli rzeczywiste prawdopodobieństwa wystąpienia danej wartości cechy w populacji, to mówimy o rozkładzie w populacji. Jeśli mamy na myśli prawdopodobieństwa wystąpienia danej cechy wyznaczone podczas badania statystycznego, to mówimy o rozkładzie empirycznym.
Zobacz też [edytuj]
- rozkład brzegowy
- rozkład warunkowy
- rozkład stabilny
- rozkład stacjonarny
- zbieżność według rozkładu
- splot rozkładów
- skośność rozkładu
Przypisy
- ↑ Ściślej musi to być funkcja
-mierzalna, gdzie
jest rodziną podzbiorów borelowskich przestrzeni
. Jako
zwykle wybiera się jedną z tzw. przestrzeni polskich, do których zaliczają się w szczególności przestrzenie euklidesowe.

oraz
dla każdego
,
,
,
,
.
.
oraz
.
oraz
,
,
,
,
oraz
,
oraz
,
.
;
.
,
.
-mierzalna, gdzie
jest rodziną podzbiorów borelowskich przestrzeni