Czynnik Bayesa

Czynnik Bayesa (BF, ang. Bayes factor) – stosunek prawdopodobieństwa uzyskania danych obserwacji w dwóch porównywanych modelach. Pozwala on na porównanie, w jakim stopniu dane świadczą na rzecz dwóch alternatywnych hipotez, i jest jedną z metod weryfikowania hipotez statystycznych we wnioskowaniu bayesowskim^[1]^[2].

Definicja[edytuj | edytuj kod]

Zakładając, że porównujemy dwa modele $M_{1}$ i $M_{2}$ (wraz z wektorami parametrów $\theta _{1}$ i $\theta _{2}$ ) w oparciu o zbiór obserwacji $D,$ ich prawdopodobieństwo można porównać przy użyciu czynniku Bayesa $K{:}$

K={\frac {\Pr(D|M_{1})}{\Pr(D|M_{2})}}={\frac {\int \Pr(\theta _{1}|M_{1})\Pr(D|\theta _{1},M_{1})\,d\theta _{1}}{\int \Pr(\theta _{2}|M_{2})\Pr(D|\theta _{2},M_{2})\,d\theta _{2}}}.

Spotyka się też notację BF₁₀ i BF₀₁, odpowiadające czynnikom Bayesa testującym, odpowiednio, hipotezę alternatywną H₁, lub hipotezę zerową H₀, przeciwko sobie nawzajem, analogicznie do procedury częstościowej weryfikacji hipotez statystycznych.

Interpretacja[edytuj | edytuj kod]

Wartości $K>1$ świadczą na rzecz hipotezy $M_{1},$ wartości $K<1$ świadczą na rzecz hipotezy $M_{2}.$ Dla porównania, w podejściu częstościowym, testowana jest jedynie hipoteza zerowa, a o prawdziwości hipotezy alternatywnej można wnioskować jedynie pośrednio. Dwie popularne skale interpretacyjne dla wartości $K$ stworzyli Harold Jeffreys, oraz Hass i Raftery^[3]^[4]:

K (Jeffreys)	K (Hass i Raftery)	Siła dowodowa
< 1	< 1	negatywna (wspiera M₂)
od 1 do 10^1/2 (≈3,16)	od 1 do 3	warta co najwyżej wzmianki
od 10^1/2 (≈3,16) do 10	od 3 do 20	znaczna
od 10 do 10^3/2 (≈31,62)	od 20 do 150	silna
od 10^3/2 (≈31,62) do 100	> 150	bardzo silna
>100		rozstrzygająca

Czynnik Bayesa jest adekwatny do zastosowań epistemologicznych – gdy badacz chce określić relatywne, subiektywne prawdopodobieństwo hipotezy. Do celów podejmowania decyzji służą inne narzędzia, uwzględniające koszt popełnienia błędów, takie jak metody statystyki częstościowej, lub metody bayesowskie z funkcjami strat.

Wartość czynnika Bayesa porównującego hipotezę zerową z hipotezą alternatywną jest w znacznym stopniu współzmienna z odpowiadającą mu P-wartością. Jego przewagą jest w tym przypadku dokładniejsze rozstrzyganie wartości dowodowej wyników, które są bliskie krytycznego poziomu istotności^[5]. Przy wysokiej mocy statystycznej badania, mogą być bardziej prawdopodobne dla hipotezy zerowej, jednak w procedurze wnioskowania częstościowego są uznawane za przesłankę na rzecz hipotezy alternatywnej^[6]. Czynnik Bayesa pozwala też na łatwe wykonywanie innych porównań, np. minimalnej istotnej klinicznie różnicy.

Przypisy[edytuj | edytuj kod]

↑ Michael E.J.M.E.J. Masson Michael E.J.M.E.J., A tutorial on a practical Bayesian alternative to null-hypothesis significance testing, „Behavior Research Methods”, 43 (3), 2011, s. 679–690, DOI: 10.3758/s13428-010-0049-5, ISSN 1554-3528 [dostęp 2017-01-13] (ang.).
↑ Andrew F.A.F. Jarosz Andrew F.A.F., JenniferJ. Wiley JenniferJ., What Are the Odds? A Practical Guide to Computing and Reporting Bayes Factors, „The Journal of Problem Solving”, 7 (1), 2014, DOI: 10.7771/1932-6246.1167, ISSN 1932-6246 [dostęp 2017-01-13] .
↑ HaroldH. Jeffreys HaroldH., The Theory of Probability, OUP Oxford, 6 sierpnia 1998, s. 432, ISBN 978-0-19-158967-6 [dostęp 2017-01-13] (ang.).
↑ Robert E.R.E. Kass Robert E.R.E., Adrian E.A.E. Raftery Adrian E.A.E., Bayes Factors, „Journal of the American Statistical Association”, 90 (430), 1995, s. 773–795, DOI: 10.1080/01621459.1995.10476572, ISSN 0162-1459 [dostęp 2017-01-13] .
↑ RuudR. Wetzels RuudR. i inni, Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests, „Perspectives on Psychological Science: A Journal of the Association for Psychological Science”, 6 (3), 2011, s. 291–298, DOI: 10.1177/1745691611406923, ISSN 1745-6916, PMID: 26168519 [dostęp 2017-01-15] .
↑ DaniëlD. Lakens DaniëlD., On the challenges of drawing conclusions fromp-values just below 0.05, „PeerJ”, 3, 2015, DOI: 10.7717/peerj.1142, ISSN 2167-8359, PMID: 26246976, PMCID: PMC4525697 [dostęp 2017-01-15] (ang.).

[1] Michael E.J.M.E.J. Masson Michael E.J.M.E.J., A tutorial on a practical Bayesian alternative to null-hypothesis significance testing, „Behavior Research Methods”, 43 (3), 2011, s. 679–690, DOI: 10.3758/s13428-010-0049-5, ISSN 1554-3528 [dostęp 2017-01-13] (ang.).

[2] Andrew F.A.F. Jarosz Andrew F.A.F., JenniferJ. Wiley JenniferJ., What Are the Odds? A Practical Guide to Computing and Reporting Bayes Factors, „The Journal of Problem Solving”, 7 (1), 2014, DOI: 10.7771/1932-6246.1167, ISSN 1932-6246 [dostęp 2017-01-13] .

[3] HaroldH. Jeffreys HaroldH., The Theory of Probability, OUP Oxford, 6 sierpnia 1998, s. 432, ISBN 978-0-19-158967-6 [dostęp 2017-01-13] (ang.).

[4] Robert E.R.E. Kass Robert E.R.E., Adrian E.A.E. Raftery Adrian E.A.E., Bayes Factors, „Journal of the American Statistical Association”, 90 (430), 1995, s. 773–795, DOI: 10.1080/01621459.1995.10476572, ISSN 0162-1459 [dostęp 2017-01-13] .

[5] RuudR. Wetzels RuudR. i inni, Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests, „Perspectives on Psychological Science: A Journal of the Association for Psychological Science”, 6 (3), 2011, s. 291–298, DOI: 10.1177/1745691611406923, ISSN 1745-6916, PMID: 26168519 [dostęp 2017-01-15] .

[6] DaniëlD. Lakens DaniëlD., On the challenges of drawing conclusions fromp-values just below 0.05, „PeerJ”, 3, 2015, DOI: 10.7717/peerj.1142, ISSN 2167-8359, PMID: 26246976, PMCID: PMC4525697 [dostęp 2017-01-15] (ang.).

[1]

[2]

[3]

[4]

[5]

[6]