Rozkład Dirichleta

Rozkład Dirichleta
	Gęstość prawdopodobieństwa; ; Kilka wykresów gęstości prawdopodobieństwa dla rozkładu Dirichleta, kiedy dla różnych parametrów wektorów Zgodnie z kierunkiem wskazówek zegara od górnego lewego: (6; 2; 2), (3; 7; 5), (6; 2; 6), (2; 3; 4).
Parametry	ilość kategorii (całkowitych); parametry skupienia, gdzie
Nośnik	gdzie oraz
Gęstość prawdopodobieństwa	; gdzie ; gdzie
Wartość oczekiwana (średnia)	;
Moda
Wariancja	; gdzie ;
Entropia

Rozkład Dirichleta – rodzina ciągłych rozkładów prawdopodobieństwa wielu zmiennych, określona wektorem ${\boldsymbol {\alpha }}$ dodatnich liczb rzeczywistych. Stanowi uogólnienie rozkładu beta w przestrzeni wielu zmiennych.

Rozkład Dirichleta jest często używany w rachunku prawdopodobieństwa wraz z twierdzeniem Bayesa jak rozkład aprioryczny i faktycznie rozkład Dirichleta jest rozkładem komunigacyjnym rozkładu dyskretnego. W efekcie funkcja rozkładu zwraca przekonanie, że prawdopodobieństwo $K$ możliwych zdarzeń losowych wynosi $x_{i},$ biorąc pod uwagę, że każde zdarzenie zostało zaobserwowane $\alpha _{i}-1$ razy.

Wielowymiarowym uogólnieniem rozkładu Dirichleta jest proces Dirichleta.

Definicja formalna[edytuj | edytuj kod]

Rozkład Dirichleta rzędu $K\geqslant 2$ z parametrami $\alpha _{1},\dots ,\alpha _{K}>0$ ma funkcję rozkładu prawdopodobieństwa w mierze Lebesgue’a dla przestrzeni euklidesowej $\mathrm {R} ^{K-1}$ określoną zależnością:

f(x_{1},\dots ,x_{K-1};\alpha _{1},\dots ,\alpha _{K})={\frac {1}{\mathrm {B} (\alpha )}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1},

na otwartym zbiorze $(K{-}1)$ -wymiarowego sympleksu określonego jako:

{\begin{aligned}&x_{1},\dots ,x_{K-1}>0\\&x_{1}+\ldots +x_{K-1}<1\\&x_{K}=1-x_{1}-\ldots -x_{K-1}\end{aligned}}

oraz zero poza.

Stałą normalizującą jest wielomianowa funkcja B, którą można wyrazić w zależności od funkcji gamma:

\mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma \left(\sum _{i=1}^{K}\alpha _{i}\right)}},\qquad {\boldsymbol {\alpha }}=(\alpha _{1},\dots ,\alpha _{K}).

Nośnik[edytuj | edytuj kod]

Nośnikiem rozkładu Dirichleta jest zbiór $K$ -wymiarowych wektorów ${\boldsymbol {x}}$ określonych liczbami rzeczywistymi w zakresie (0,1), tak więc $\|{\boldsymbol {x}}\|_{1}=1,$ co znaczy, że suma wszystkich składowych jest 1. Mogą być one przedstawiane jako prawdopodobieństwa $K$ -wymiarowego zdarzenia. Należy zauważyć, iż w praktyce zbiór punktów w nośnika dla $K$ -wymiarowego rozkładu Dirichleta jest zamkniętym zbiorem $(K{-}1)$ -sympleksów, znajdujących się w przestrzeni $K$ -wymiarowej. Przykładowo dla $K=3$ jest to trójkąt równoboczny zawarty w trójwymiarowej przestrzeni z wierzchołkami (1;0;0), (0;1;0) oraz (0;0;1), „dotykający” każdej z osi w odległości 1 od początku układu współrzędnych.

Zobacz też[edytuj | edytuj kod]

Linki zewnętrzne[edytuj | edytuj kod]

Gęstość prawdopodobieństwa Kilka wykresów gęstości prawdopodobieństwa dla rozkładu Dirichleta, kiedy $K=3$ dla różnych parametrów wektorów $\alpha .$ Zgodnie z kierunkiem wskazówek zegara od górnego lewego: $\alpha ={}$ (6; 2; 2), (3; 7; 5), (6; 2; 6), (2; 3; 4).
Parametry	$K\geqslant 2$ ilość kategorii (całkowitych) $\alpha _{1},\dots ,\alpha _{K}$ parametry skupienia, gdzie $\alpha _{i}>0$
Nośnik	$x_{1},\dots ,x_{K}$ gdzie $x_{i}\in [0,1]$ oraz $\sum _{i=1}^{K}x_{i}=1$
Gęstość prawdopodobieństwa	${\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}$ gdzie $\mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma {\big (}\sum _{i=1}^{K}\alpha _{i}{\big )}}}$ gdzie ${\boldsymbol {\alpha }}=(\alpha _{1},\dots ,\alpha _{K})$
Wartość oczekiwana (średnia)	$\operatorname {E} [X_{i}]={\frac {\alpha _{i}}{\sum _{k}\alpha _{k}}}$ $\operatorname {E} [\ln X_{i}]=\psi (\alpha _{i})-\psi (\textstyle \sum _{k}\alpha _{k})$
Moda	$x_{i}={\frac {\alpha _{i}-1}{\sum _{i=1}^{K}\alpha _{i}-K}},\quad \alpha _{i}>1.$
Wariancja	$\mathrm {Var} [X_{i}]={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1)}},$ gdzie $\alpha _{0}=\sum _{i=1}^{K}\alpha _{i}$ $\mathrm {Cov} [X_{i},X_{j}]={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}~~(i\neq j)$
Entropia	$H(X)=\log \mathrm {B} (\alpha )+(\alpha _{0}-K)\psi (\alpha _{0})-\sum _{j=1}^{K}(\alpha _{j}-1)\psi (\alpha _{j})$

Rozkłady ciągłe	arcusa sinusa beta Cauchy’ego chi chi kwadrat Dirichleta Erlanga F Snedecora Fishera-Tippetta gamma jednostajny ciągły Laplace’a logarytmicznie normalny logistyczny normalny (wielowymiarowy normalny) Pareta Rayleigha Studenta trójkątny Voigta Weibulla wykładniczy
Rozkłady dyskretne	Benforda dwumianowy Rozkład dwupunktowy dzeta geometryczny hipergeometryczny jednostajny dyskretny Rozkład jednopunktowy Panjera Pascala (ujemny dwumianowy) Poissona zero-jedynkowy