Przykładowy rozkład prawdopodobieństwa pewnej zmiennej
Rozkład prawdopodobieństwa średniej dwóch takich niezależnych zmiennych
Rozkład prawdopodobieństwa średniej trzech takich niezależnych zmiennych
Rozkład prawdopodobieństwa średniej czterech takich niezależnych zmiennych. Jest już bardzo zbliżony do rozkładu normalnego.
Centralne twierdzenie graniczne – twierdzenie probabilistyki o zbieżności pewnych ciągów zmiennych losowych do rozkładu normalnego[1]. Wyjaśnia ono powszechność w przyrodzie zbliżonych do niego rozkładów prawdopodobieństwa.
Centralne twierdzenie graniczne to twierdzenie matematyczne mówiące, że jeśli
są niezależnymi zmiennymi losowymi pochodzącymi z tej samej populacji o wartości oczekiwanej
oraz dodatniej i skończonej wariancji
to ciąg zmiennych losowych, w postaci znormalizowanych wartości oczekiwanych

zbieżny jest według rozkładu do standardowego rozkładu normalnego, gdy
Tzn.

Centralne twierdzenie graniczne znane też pod nazwą twierdzenia Lindeberga-Lévy’ego mówi:
Niech
będzie schematem serii, w którym
dla
i dla każdego
mamy
Jeśli spełniony jest warunek Lindeberga, tj. dla każdego
zachodzi
to
Dowodów centralnego twierdzenia granicznego w wersji ogólnej jest kilka. Wszystkie są dość skomplikowane i wymagają korzystania z wielu zaawansowanych narzędzi matematycznych. Poniżej znajduje się jeden z prostszych dowodów, nie dający jednak oszacowania wartości błędu.
Pierwszym krokiem dowodu jest sformułowanie i udowodnienie użytecznych lematów.
Lemat 1
Niech
będzie funkcją trzykrotnie różniczkowalną taką, że
zachodzi
oraz
Wówczas:
- a)


- b)

Dowód
Oznaczmy
Wówczas
Ustalmy dowolne
Wówczas zgodnie z twierdzeniem Cauchy’ego istnieją takie
że:






Na tej samej zasadzie:



Lemat 2
Jeżeli
to

Dowód


Dokonujemy podstawienia


Teraz całkujemy przez części:



Drugi krok polega na oszacowaniu pewnej wartości:
Niech
będzie funkcją trzykrotnie różniczkowalną taką, że
oraz
Rozważamy niezależne zmienne
o rozkładzie normalnym takie, że
oraz
Wówczas:




![{\displaystyle {}-{\frac {f''(x)}{2!}}X_{n,k}^{2}{\Big ]}-E{\Big [}f(x+G_{n,k})-f(x)-f'(x)\cdot G_{n,k}-{\frac {f''(x)}{2!}}G_{n,k}^{2}{\Big ]}{\Bigg |}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2aa359c841acf4ffe9564c2ee8252804ba430ebc)


Przy czym ostatnia nierówność to nierówność trójkąta.
Drugi ze składników daje się na podstawie Lematu 1 oszacować w sposób następujący:


Tymczasem
gdzie
W związku z tym (korzystając z Lematu 2):


Wobec tego


Pierwszy ze składników można natomiast oszacować w sposób następujący:




Z kolei szacujemy:



oraz



Ostatnia nierówność wynika z Lematu 1.
Zatem
mamy następujące oszacowanie:


Trzeci krok polega na wielokrotnym zastosowaniu oszacowania uzyskanego powyżej.




Rozpatrzmy
-ty z powyższych wyrazów.
Podstawiamy

Zmienna
jest niezależna od
i
Wobec tego:









Zatem:





Pierwszy i ostatni składnik z warunku Lindeberga zbiegają do zera, gdy
dąży do nieskończoności. W związku z tym:

Oznacza to, że:

gdzie 
Czwarty krok polega na wyliczenie dystrybuanty granicznej na podstawie powyższych oszacowań.
Weźmy funkcję
spełniającą warunek 
dla pewnych
Wówczas:

Ale:
![Ef(X_{n,1}+\dots +X_{n,n}){\xrightarrow[{n\to \infty }]{}}Ef(G)](https://wikimedia.org/api/rest_v1/media/math/render/svg/390925cd6e31295bb4805f486b43756884556223)
oraz

W związku z tym:

![{\displaystyle {}\geqslant P(G\geqslant t+\delta ){\xrightarrow[{\delta \to 0^{+}}]{}}P(G\geqslant t)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b5a996cb7f7d7bc587ab81ca75467ed8e276a43c)
oraz podobnie

![{\displaystyle {}\leqslant P(G\geqslant t-\delta ){\xrightarrow[{\delta \to 0^{+}}]{}}P(G\geqslant t).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/29f5e2d97b38705b5f0ca6c7e34e008c6599ca94)
Otrzymujemy więc
![{\displaystyle P(X_{n,1}+\dots +X_{n,n}\geqslant t){\xrightarrow[{n\to \infty }]{}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7e191610febd1f3e96c47a3f5ed9f893f81ccac3)
![{\displaystyle P(G\geqslant t)\Rightarrow P(X_{n,1}+\dots +X_{n,n}<t){\xrightarrow[{n\to \infty }]{}}P(G<t).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b45dbe2f24e90700012de64000a9dd4c6644a6c7)
Ale z ciągłości dystrybuanty rozkładu normalnego wnioskujemy, że
![{\displaystyle P(X_{n,1}+\dots +X_{n,n}\leqslant t){\xrightarrow[{n\to \infty }]{}}P(G\leqslant t).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2257667123b31e56d8c86a5307647f271af52ac7)
Ponieważ punktowa zbieżność dystrybuant w punktach ciągłości dystrybuanty granicznej jest równoważna zbieżności według rozkładu, więc ostatecznie:
![{\displaystyle \sum _{k=1}^{n}X_{n,k}{\xrightarrow[{n\to \infty }]{D}}N(0,1).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ef43cb8c7ad8353cd10e88b2d0a9fba58953abb8)

- Centralne twierdzenie graniczne nie sprawi, by przy dostatecznie dużej próbie rozkład stał się normalny. Jedynie rozkład średniej z tej próby upodabnia się do normalnego.
- Centralne twierdzenie graniczne jest prawdziwe tylko dla rozkładów o skończonej wariancji. Zobacz stabilność struktury.