Rozkład Dirichleta

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania
Rozkład Dirichleta
Gęstość prawdopodobieństwa
Kilka wykresów gęstości prawdopodobieństwa dla rozkładu Dirichleta, kiedy K=3 dla różnych parametrów wektorów α. Zgodnie z kierunkiem wskazówek zegara od górnego lewego: α=(6; 2; 2), (3; 7; 5), (6; 2; 6), (2; 3; 4).
Kilka wykresów gęstości prawdopodobieństwa dla rozkładu Dirichleta, kiedy K=3 dla różnych parametrów wektorów α. Zgodnie z kierunkiem wskazówek zegara od górnego lewego: α=(6; 2; 2), (3; 7; 5), (6; 2; 6), (2; 3; 4).
Parametry ilość kategorii (całkowitych)
parametry skupienia, gdzie
Nośnik gdzie oraz
Gęstość prawdopodobieństwa
gdzie
gdzie
Wartość oczekiwana (średnia)
Moda
Wariancja
gdzie
Entropia

Rozkład Dirichleta – rodzina ciągłych rozkładów prawdopodobieństwa wielu zmiennych, określona wektorem dodatnich liczb rzeczywistych. Stanowi uogólnienie rozkładu beta w przestrzeni wielu zmiennych. Rozkład Dirichleta jest często używany w rachunku prawdopodobieństwa wraz z twierdzeniem Bayesa jak rozkład aprioryczny i faktycznie rozkład Dirichleta jest rozkładem komunigacyjnym rozkładu dyskretnego. W efekcie funkcja rozkładu zwraca przekonanie, że prawdopodobieństwo K możliwych zdarzeń losowych wynosi biorąc pod uwagę, że każde zdarzenie zostało zaobserwowane razy.

Wielowymiarowym uogólnieniem rozkładu Dirichleta jest proces Dirichleta.

Definicja formalna[edytuj | edytuj kod]

Wykres ilustruje jak zmienia się logarytm funkcji rozkładu kiedy K=3 i zmieniany jest wektor α od α=(0,3, 0,3, 0,3) do (2,0, 2,0, 2,0), zachowując wszystkie równe sobie nawzajem.

Rozkład Dirichleta rzędu K ≥ 2 z parametrami α1, ..., αK > 0 ma funkcję rozkładu prawdopodobieństwa w mierze Lebesgue’a dla przestrzeni euklidesowej RK−1 określoną zależnością:

na otwartym zbiorze (K − 1)-wymiarowego sympleksu określonego jako:

oraz zero poza.

Stałą normalizującą jest wielomianowa funkcja B, którą można wyrazić w zależności od funkcji gamma:

Nośnik[edytuj | edytuj kod]

Nośnikiem rozkładu Dirichleta jest zbiór K-wymiarowych wektorów określonych liczbami rzeczywistymi w zakresie (0,1), tak więc , co znaczy że suma wszystkich składowych jest 1. Mogą być one przedstawiane jako prawdopodobieństwa K-wymiarowego zdarzenia. Należy zauważyć, iż w praktyce zbiór punktów w nośnika dla K-wymiarowego rozkładu Dirichleta jest zamkniętym zbiorem (K−1)-sympleksów, znajdujących się w przestrzeni K-wymiarowej. Przykładowo dla K=3 jest to trójkąt równoboczny zawarty w trójwymiarowej przestrzeni z wierzchołkami (1;0;0), (0;1;0) oraz (0;0;1), „dotykający” każdej z osi w odległości 1 od początku układu współrzędnych.

Zobacz też[edytuj | edytuj kod]

Linki zewnętrzne[edytuj | edytuj kod]