Analiza sekwencyjna

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Analiza sekwencyjna – technika statystyczna pozwalająca realizować badanie etapowo, i przerwać je gdy tylko jedna z analiz etapowych wykaże, że zebrane do tego momentu wyniki wystarczają do potwierdzenia hipotezy badawczej.

W odróżnieniu od niezaplanowanego „podglądania danych”, które jest nadużyciem metodologicznym, i podwyższa ryzyko błędnego uznania fałszywej hipotezy za prawdziwą (popełnienia błędu I rodzaju), analiza sekwencyjna uwzględnia poprawki na wielokrotne testowanie danych, dzięki czemu kontroluje błąd I rodzaju na nominalnym poziomie istotności. Zatrzymanie pobierania danych następuje zgodnie z predefiniowaną regułą zatrzymania obserwacji. Wniosek można dzięki temu postawić często wcześniej niż w klasycznym podejściu testowania hipotez statystycznych lub estymacji, co zmniejsza koszty badania. Jest to szczególnie użyteczne w obszarach, w których uzyskanie każdej obserwacji jest wyjątkowo drogie, niebezpieczne, lub w inny sposób trudne – np. w wieloletnich medycznych badaniach klinicznych.

Procedury[edytuj]

Proste procedury korekcji wartości p dla analiz etapowych zaproponowali m.in. Pocock[1][2], O'Brien i Fleming[3], Haybittle i Peto[4][5], oraz Lan i DeMets[6]. Niektóre z tych metod nazywa się „wydatkowaniem wartości p”, ponieważ w praktyce polegają na proporcjonalnym rozdzielaniu ogólnego, przyjętego ryzyka popełnienia błędu I rodzaju (np. konwencjonalne 5%) na określoną liczbę części.

Należy zaznaczyć, że choć stosuje się niższe nominalne wartości krytyczne w analizach pośrednich, ryzyko popełnienia błędu I rodzaju dla całego badania pozostaje na pełnym poziomie, np. 5%, i tak należy je sprawozdać[7].

Metoda Pococka[edytuj]

Metoda Pococka jest prosta, ale wymaga zaplanowania z góry liczby analiz etapowych[1][2].

Przykładowe skorygowane wartości p dla analiz etapowych, przy założeniu że w badaniu przyjęto poziom istotności α=0,05
Liczba zaplanowanych analiz etapowych Analiza etapowa Krytyczna wartość p
2 1 0,0294
  2 (końcowa) 0,0294
3 1 0,0221
  2 0,0221
  3 (końcowa) 0,0221
4 1 0,0182
  2 0,0182
  3 0,0182
  4 (końcowa) 0,0182
5 1 0,0158
  2 0,0158
  3 0,0158
  4 0,0158
  5 (końcowa) 0,0158

Metoda Haybittle–Peto[edytuj]

Metoda Haybittle–Peto jest bardziej konserwatywna[4][5].

Przykładowe skorygowane wartości p dla analiz etapowych, przy założeniu że w badaniu przyjęto poziom istotności α=0,05
Liczba zaplanowanych analiz etapowych Analiza etapowa Krytyczna wartość p
2 1 0,001
  2 (końcowa) 0,05
3 1 0,001
  2 0,001
  3 (końcowa) 0,05
4 1 0,001
  2 0,001
  3 0,001
  4 (końcowa) 0,05
5 1 0,001
  2 0,001
  3 0,001
  4 0,001
  5 (końcowa) 0,05

Historia[edytuj]

Analiza sekwencyjna została stworzona przez Abrahama Walda ze współpracownikami na uniwersytecie Columbia jako narzędzie do bardziej efektywnego sterowania jakością produkcji w czasie II wojny światowej. Ze względu na ich dużą użyteczność, były objęte tajemnicą do końca wojny[8]. W późniejszych latach technikę rozwijał m.in. Kenneth Arrow[9].

Metody sekwencyjne były wykorzystywane w trakcie wojny niezależnie przez Alana Turinga, jako część procedury Banburismus, stosowanej w ośrodku kryptograficznym w Bletchley Park do weryfikacji hipotez roboczych na temat tego, czy różne wiadomości szyfrowane Enigmą mogą być łączone razem w celu analizy. Badania te objęte były tajemnicą do początku lat osiemdziesiątych 20. wieku.

Literatura[edytuj]

  • Abraham Wald, "Sequential Tests of Statistical Hypotheses", Annals of Mathematical Statistics, 16, (1945), 117–186
  • Abraham Wald, Sequential Analysis, (1947)
  • Stanisław Trybuła "Sequential estimation in processses with independent increments", Dissertationes Mathematicae, 60, (1968), 1–46

Zobacz też[edytuj]

Linki zewnętrzne[edytuj]

Przypisy

  1. a b Stuart J.S.J. Pocock Stuart J.S.J., Group Sequential Methods in the Design and Analysis of Clinical Trials, „Biometrika”, 64 (2), 1977, DOI10.2307/2335684, ISSN 0006-3444, JSTOR2335684 [dostęp 2017-01-31] (ang.).
  2. a b Stuart J.S.J. Pocock Stuart J.S.J., Interim Analyses for Randomized Clinical Trials: The Group Sequential Approach, „Biometrics”, 38 (1), , s. 153–162, DOI10.2307/2530298, JSTOR2530298 [dostęp 2017-01-31].
  3. Peter C.P.C. O'Brien Peter C.P.C., Thomas R.T.R. Fleming Thomas R.T.R., A Multiple Testing Procedure for Clinical Trials, „Biometrics”, 35 (3), , s. 549–556, DOI10.2307/2530245, JSTOR2530245 [dostęp 2017-01-31].
  4. a b J. L.J.L. Haybittle J. L.J.L., Repeated assessment of results in clinical trials of cancer treatment, „The British Journal of Radiology”, 44 (526), 1971, s. 793–797, DOI10.1259/0007-1285-44-526-793, ISSN 0007-1285 [dostęp 2017-01-31].
  5. a b R.R. Peto R.R., M. C.M.C. Pike M. C.M.C., P.P. Armitage P.P., N. E.N.E. Breslow N. E.N.E., D. R.D.R. Cox D. R.D.R. i inni, Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design, „British Journal of Cancer”, 34 (6), 1976, s. 585–612, DOI10.1038/bjc.1976.220, ISSN 0007-0920 [dostęp 2017-01-31] (ang.).
  6. K. K. GORDONK.K.G. LAN K. K. GORDONK.K.G., DAVID L.D.L. DEMETS DAVID L.D.L., Discrete sequential boundaries for clinical trials, „Biometrika”, 70 (3), 1983, s. 659–663, DOI10.1093/biomet/70.3.659, ISSN 0006-3444 [dostęp 2017-01-31] (ang.).
  7. Kenneth FK.F. Schulz Kenneth FK.F., David AD.A. Grimes David AD.A., Multiplicity in randomised trials II: subgroup and interim analyses, „The Lancet”, 365 (9471), s. 1657–1661, DOI10.1016/s0140-6736(05)66516-6.
  8. Jean-FrançoisJ. Hêche Jean-FrançoisJ., Thomas M.T.M. Liebling Thomas M.T.M., Dominique deD. Werra Dominique deD., Recherche opérationnelle pour ingénieurs, PPUR presses polytechniques, , s. 145, ISBN 9782880744595 [dostęp 2017-01-31] (fr.).
  9. K. J.K.J. Arrow K. J.K.J., D.D. Blackwell D.D., M. A.M.A. Girshick M. A.M.A., Bayes and Minimax Solutions of Sequential Decision Problems, „Econometrica”, 17 (3/4), , s. 213–244, DOI10.2307/1905525, JSTOR1905525 [dostęp 2017-01-31].