Próbkowanie Monte Carlo łańcuchami Markowa: Różnice pomiędzy wersjami

Przeglądaj historię interaktywnie

[wersja nieprzejrzana]

← poprzednia edycja następna edycja →

Usunięta treść Dodana treść

WizualnieWikikod

Jednokolumnowy

Wersja z 16:37, 7 lis 2018

Ten artykuł został przetłumaczony z Wikipedii w języku angielskim. Przetłumaczona treść w części lub w całości pochodzi z artykułu Markov chain Monte Carlo. Zobacz autorów tego artykułu.
Treści pochodzące z Wikipedii w języku angielskim są oparte na licencji Creative Commons 4.0 – Uznanie Autorstwa – Na tych samych warunkach. Kopiując je lub tłumacząc, należy podać ich autorów i udostępnić na tych samych warunkach.

Próbkowanie Monte Carlo łańcuchami Markowa (ang. Markov Chain Monte Carlo, MCMC) – w statystyce klasa algorytmów próbkowania z rozkładu prawdopodobieństwa. Poprzez budowę Łańcucha Markowa, który ma rozkład równowagowy taki jak szukana dystrybucja, można wydajnie próbkować złożone rozkłady prawdopodobieństwa. Im większa liczba kroków w takim algorytmie, tym dokładniej rozkład próbki odpowiada pożądanemu rozkładowi.

Błądzenie losowe Monte-Carlo jest istotną dużą podklasą takich procesów próbkowania.

Dziedziny stosowania

Algorytmy MCMC są używane głównie do obliczania przybliżeń numerycznych dla całek wielowymiarowych, na przykład w statystyce Bayesowskiej, fizyce komputerowej, biologii obliczeniowej^[1] i lingwistyce komputerowej^[2]^[3].

W statystyce Bayesowskiej nowe badania algorytmów MCMC były kluczowym krokiem potrzebnym do wyliczania dużych modeli hierarchicznych, które wymagają całkowania w dziedzinach setek parametrów swobodnych^[4].

W próbkowaniu rzadkich zdarzeń są one również wykorzystywane do tworzenia próbek, które stopniowo odzwierciedlają rzadko odwiedzane obszary (co jest szczególnie istotne dla obszarów ryzyka).

Przykłady

Przykłady błądzenia losowego Monte Carlo obejmuje następujące algorytmy:

Algorytm Metropolis–Hastings: ta metoda generuje błądzenie losowe w oparciu o gęstość przyjmowania i odrzucania propozycji kolejnych kroków.
Próbkowanie Gibbsa: ta metoda dodatkowo wymaga, aby wszystkie warunkowe rozkłady prawdopodobieństwa docelowego rozkładu były znane (z dokładnością do stałej). Gdy próbkowanie warunkowych rozkładów nie jest łatwe, inne sub-metody próbkowanie mogą być użyte (patrz na przykład^[5]^[6]^[7]). Próbkowanie Gibbsa zawdzięcza swoją popularność głównie brakowi parametrów swobodnych.
Próbkowanie przekrojów: Ta metoda opiera się na obserwacji, że dystrybucje można wiernie próbkować poprzez jednorodne próbkowanie odpowiednich podzbiorów dziedziny. Metoda wykonuje dwa rodzaje kroków naprzemiennie: próbkę 'w pionie' z rozkładu jednorodnego i próbkę 'w poziomie' z podzbioru dziedziny dla której gęstość prawdopodobieństwa jest mniejsza od próbki 'pionowej'.
Wielokrotne Metropolis: ta metoda jest odmianą algorytmu Metropolis–Hastings, która pozwala na wiele prób w każdym punkcie. Poprzez umożliwienie dłuższych kroków w każdej iteracji, częściowo rozwiązuje "przekleństwa wymiaru"^[8]^[9].
Odwracalny-skok: ta metoda jest odmiana algorytmu Metropolis–Hastings, która pozwala na dynamiczną zmianę wymiaru przestrzeni próbkowania^[10]. Algorytmy MCMC, które zmieniają wymiar są stosowane w mechanice statystycznej, gdzie dla pewnych przypadków próbkowany rozkład układu wielkiego kanonicznego (na przykład gdy liczba cząsteczek w dziedzinie jest zmienna) zmienia wymiar dziedziny.

Redukowanie korelacji

Bardziej złożone metody wykorzystują różne sposoby, aby zmniejszyć korelację pomiędzy kolejnymi próbkami. Algorytmy te mogą być trudniejsze w implementacji, ale często wykazują szybszą zbieżność (tj. mniejszą ilość kroków w celu uzyskania tej samej dokładności próbkowania).

Przykłady

Przykłady MCMC, nie należących do metod błądzenia losowego obejmują następujące algorytmy:

Hybrydowa metoda Monte-Carlo (HMC): unika błądzenia losowego poprzez wprowadzenie pędu i równań Hamiltonowskich, takich że energia potencjalna jest proporcjonalna do docelowego rozkładu prawdopodobieństwa. Takie podejście skutkuje szybszym poruszaniem się po dziedzinie próbkowania i daje lepszą zbieżność do docelowego rozkładu.
Istnieją też warianty próbkowania przekrojów, które nie korzystają z błądzenia losowego^[11].
MCMC Langevina i inne metody oparte na gradiencie (czasem także na drugiej pochodnej) logarytmu rozkładu warunkowego pozwalają na tworzenie propozycji, które mają większą szansę na poruszanie się w kierunku dużej gęstości prawdopodobieństwa^[12].

Przypisy

↑ Ankur Gupta, James B. Rawlings. Comparison of Parameter Estimation Methods in Stochastic Chemical Kinetic Models: Examples in Systems Biology. „AIChE pismo”. 60 (4), s. 1253–1268, April 2014. DOI: 10.1002/aic.14409. PMID: 27429455. PMCID: PMC4946376.
↑ Zobacz: Gill 2008.
↑ Zobacz: Robert & Casella 2004.
↑ Sudipto Banerjee, Bradley P. Carlin, Alan P. Gelfand: Hierarchical Modeling and Analysis for Spatial Data. Wyd. Wyd.2. CRC Press, s. xix. ISBN 978-1-4398-1917-3.
↑ W. R. Gilks, P. Wild. Adaptive Rejection Sampling for Gibbs Sampling. „Journal of the Royal Statistical Society. Series C (Applied Statistics)”. 41 (2), s. 337–348, 1992-01-01. DOI: 10.2307/2347565. JSTOR: 2347565.
↑ W.R. Gilks, N.G. Best, K.K.C. Tan. Adaptive Rejection Metropolis Sampling within Gibbs Sampling. „Journal of the Royal Statistical Society. Series C (Applied Statistics)”. 44 (4), s. 455–472, 1995-01-01. DOI: 10.2307/2986138. JSTOR: 2986138.
↑ L. Martino, J. Read, D. Luengo. Independent Doubly Adaptive Rejection Metropolis Sampling Within Gibbs Sampling. „IEEE Transactions on Signal Processing”. 63 (12), s. 3123–3138, 2015-06-01. DOI: 10.1109/TSP.2015.2420537. arXiv:1205.5494. ISSN 1053-587X. Bibcode: 2015ITSP...63.3123M.
↑ Jun S. Liu, Faming Liang, Wing Hung Wong. The Multiple-Try Method and Local Optimization in Metropolis Sampling. „Journal of the American Statistical Association”. 95 (449), s. 121–134, 2000-03-01. DOI: 10.1080/01621459.2000.10473908. ISSN 0162-1459.
↑ Luca Martino, Jesse Read. On the flexibility of the design of multiple try Metropolis schemes. „Computational Statistics”. 28 (6), s. 2797–2823, 2013-07-11. DOI: 10.1007/s00180-013-0429-2. arXiv:1201.0646. ISSN 0943-4062.
↑ Zobacz: Green 1995.
↑ Zobacz: Neal 2003.
↑ Zobacz: Stramer 1999.

Biliografia

Szablon:Refbegin

Christophe Andrieu, Nando De Freitas, Arnaud Doucet and Michael I. Jordan An Introduction to MCMC for Machine Learning, 2003
Szablon:Cite book
Szablon:Cite web
Szablon:Cite book
Szablon:Cite book
Szablon:Cite journal
Szablon:Cite journal
Szablon:Cite book (See Chapter 11.)
Szablon:Cite journal
Szablon:Cite book
Szablon:Cite book
Szablon:Cite journal
Szablon:Cite journal
Szablon:Cite web
Szablon:Cite book
Szablon:Cite book
Szablon:Cite journal
Szablon:Cite journal
Szablon:Cite journal

Szablon:Refend

[1] Ankur Gupta, James B. Rawlings. Comparison of Parameter Estimation Methods in Stochastic Chemical Kinetic Models: Examples in Systems Biology. „AIChE pismo”. 60 (4), s. 1253–1268, April 2014. DOI: 10.1002/aic.14409. PMID: 27429455. PMCID: PMC4946376.

[2] Zobacz: Gill 2008.

[3] Zobacz: Robert & Casella 2004.

[4] Sudipto Banerjee, Bradley P. Carlin, Alan P. Gelfand: Hierarchical Modeling and Analysis for Spatial Data. Wyd. Wyd.2. CRC Press, s. xix. ISBN 978-1-4398-1917-3.

[5] W. R. Gilks, P. Wild. Adaptive Rejection Sampling for Gibbs Sampling. „Journal of the Royal Statistical Society. Series C (Applied Statistics)”. 41 (2), s. 337–348, 1992-01-01. DOI: 10.2307/2347565. JSTOR: 2347565.

[6] W.R. Gilks, N.G. Best, K.K.C. Tan. Adaptive Rejection Metropolis Sampling within Gibbs Sampling. „Journal of the Royal Statistical Society. Series C (Applied Statistics)”. 44 (4), s. 455–472, 1995-01-01. DOI: 10.2307/2986138. JSTOR: 2986138.

[:0-7] L. Martino, J. Read, D. Luengo. Independent Doubly Adaptive Rejection Metropolis Sampling Within Gibbs Sampling. „IEEE Transactions on Signal Processing”. 63 (12), s. 3123–3138, 2015-06-01. DOI: 10.1109/TSP.2015.2420537. arXiv:1205.5494. ISSN 1053-587X. Bibcode: 2015ITSP...63.3123M.

[8] Jun S. Liu, Faming Liang, Wing Hung Wong. The Multiple-Try Method and Local Optimization in Metropolis Sampling. „Journal of the American Statistical Association”. 95 (449), s. 121–134, 2000-03-01. DOI: 10.1080/01621459.2000.10473908. ISSN 0162-1459.

[9] Luca Martino, Jesse Read. On the flexibility of the design of multiple try Metropolis schemes. „Computational Statistics”. 28 (6), s. 2797–2823, 2013-07-11. DOI: 10.1007/s00180-013-0429-2. arXiv:1201.0646. ISSN 0943-4062.

[10] Zobacz: Green 1995.

[11] Zobacz: Neal 2003.

[12] Zobacz: Stramer 1999.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]