Twierdzenie de Moivre’a-Laplace’a

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj
Wraz ze wzrostem liczby prób wykres rozkładu dwumianowego coraz bardziej przypomina wykres krzywej Gaussa.

Twierdzenie de Moivre’a-Laplace’a – dwa twierdzenia rachunku prawdopodobieństwa nazywane lokalnym i całkowym (integralnym) wskazujące związek rozkładu dwumianowego (Bernoulliego) z rozkładem normalnym; można traktować go jako szczególny przypadek centralnego twierdzenia granicznego.

Przypadek symetryczny pochodzi z wydrukowanej w 1730 roku pracy Miscellanea analytica de seriebus et quadraturis („Rozmaite analityka o szeregach i kwadraturach”)[1] od Abrahama de Moivre’a, a niesymetryczny – z opublikowanego w trzy lata później dodatku Miscelaneis analyticis supplementum z 1733 roku; szerszej publiczności twierdzenia zaprezentowane zostały w drugim wydaniu dzieła The Doctrine of Chances: or, a method for calculating the probabilities of events in play („Doktryna szans: lub, metoda obliczania prawdopodobieństw zdarzeń w grze”) z 1738 roku. Twierdzenie w pełnej ogólności udowodnił Pierre Simon de Laplace w pracy Théorie analytique des probabilités („Analityczna teoria prawdopodobieństw”) z 1812 roku, który nie miał w zwyczaju powoływać się na źródła – z tego powodu do XX wieku prace Moivre’a były szerzej nieznane[2].

Twierdzenia de Moivre’a-Laplace’a[edytuj]

Oznaczenia
Niech oznacza rozkład dwumianowy dla procesu Bernoulliego, w którym prawdopodobieństwo osiągnięcia dokładnie sukcesów o prawdopodobieństwie w próbach dane jest wzorem
gdzie jest prawdopodobieństwem porażki, a oznacza liczbę sukcesów; ponadto niech oraz oznaczają odpowiednio wartość oczekiwaną i odchylenie standardowe tego rozkładu.
Rozpatrywana będzie unormowana wersja powyższego rozkładu, tzn. jego wartość oczekiwana będzie równa zeru, a jego wariancja (odchylenie standardowe) będzie jednostkowa, czyli zamiast liczby sukcesów rozważana będzie jej unormowana wersja W związku z tym niżej stosowane będą również następujące oznaczenia: to szerokość przedziału klasowego, to unormowane odchylenie liczby sukcesów od średniej; wygodnie będzie zakładać, że nie musi być naturalne – w szczególności skąd
Funkcja będzie oznaczać gęstość unormowanego rozkładu normalnego o dystrybuancie podczas gdy będzie oznaczać gęstość rozkładu normalnego o dystrybuancie
Twierdzenie lokalne
Jeżeli to
gdzie
W szczególności dla czyli
Twierdzenie całkowe
Jeżeli to
gdzie
W szczególności dla oraz zmieniających się tak, by jest wtedy
zachodzi również następujące, mniej dokładne, ale prostsze, a przez to częściej stosowane, przybliżenie:

W zastosowaniach najczęściej spotyka się następujący wniosek z twierdzenia całkowego:

Wniosek
Jeżeli są stałe, to

Przykłady[edytuj]

Liczebność próby
Twierdzenie de Moivre’a-Laplace’a można wykorzystać do określenia minimalnej liczebności próby losowej z danej populacji w danym badaniu mającym na celu jak najbardziej miarodajne oszacowanie danej obserwacji, która zachodzi z pewnym prawdopodobieństwem, bądź nie (tj. zachodzącej zgodnie z rozkładem zero-jedynkowym). Przykładowo: w badaniu przesiewowym choroby, która jest na tyle rzadka, że nie choruje na nią więcej niż populacji, przy czym błąd ma być mniejszy niż z prawdopodobieństwem w celu wskazania chorych z ustaloną pewnością należałoby wybrać próbę co najmniej -osobową[3].
Reguła 3σ
Opierając się na twierdzeniu całkowym można się spodziewać, że reguła trzech sigm sformułowana dla rozkładu normalnego zachodzi również dla procesu Bernoulliego. Jedną z jej wersji jest
o ile oraz co można krótko zapisać [4].

Przypisy

  1. W pracy, którą autor przekazał jedynie kilku znajomym, pojawia się wzór postaci gdzie który posłużył do wyprowadzenia opisanych w tym artykule twierdzeń, znany obecnie jako wzór Stirlinga, przy czym James Stirling zauważył jedynie, że o czym autor wspomina w drugim wydaniu tej pracy 1933 roku z dwoma dodatkami.
  2. Szczegóły można znaleźć w artykułach Raymonda Clare Archibalda i Karla Pearsona z 1926 roku zebranych w tej pracy.
  3. Skoro oznacza prawdopodobieństwo zapadnięcia jednostki na daną chorobą, a jest oszacowaniem procenta chorych w populacji, to skąd W tablicach statystycznych można znaleźć, iż (gdyż wtedy ), dlatego powinno spełniać warunek a ponieważ to przyjmuje największą wartość dla zatem
  4. Dla przypadku symetrycznego oznacza to, że w przypadku prawdopodobieństwo wynosi liczbę wzięto zapewne od popularnego oszacowania dla rozkładu normalnego, dla którego Twierdzenie to można wzmacniać korzystając z wyników w rodzaju nierówności Bernsteina.