Centralne twierdzenie graniczne
Centralne twierdzenie graniczne – jedno z najważniejszych twierdzeń rachunku prawdopodobieństwa, uzasadniające powszechne występowanie w przyrodzie rozkładów zbliżonych do rozkładu normalnego.
Spis treści |
[edytuj] Teza
[edytuj] Sformułowanie szczególne
Centralne twierdzenie graniczne to twierdzenie matematyczne mówiące, że jeśli Xi są niezależnymi zmiennymi losowymi o jednakowym rozkładzie, takiej samej wartości oczekiwanej μ i skończonej wariancji σ2, to zmienna losowa o postaci
zbiega według rozkładu do standardowego rozkładu normalnego gdy n rośnie do nieskończoności.
[edytuj] Sformułowanie ogólne
Centralne twierdzenie graniczne znane też pod nazwą Twierdzenie Lindeberga-Lévy'ego orzeka:
Niech (Xn,k) będzie schematem serii, w którym EXn,k = 0 dla
i dla każdego n mamy
. Jeśli spełniony jest warunek Lindeberga, tj. dla każdego
zachodzi
, wtedy
.
[edytuj] Dowód
Dowodów Centralnego Twierdzenia Granicznego w wersji ogólnej jest kilka. Wszystkie są dość skomplikowane i wymagają korzystania z wielu zaawansowanych narzędzi matematycznych. Poniżej znajduje się jeden z prostszych dowodów, nie dający jednak oszacowania wartości błędu.
Pierwszym krokiem dowodu jest sformułowanie i udowodnienie użytecznych lematów.
Lemat 1
Niech
będzie funkcją trzykrotnie różniczkowalną taką, że
zachodzi
oraz
. Wówczas: 
- a)


- b)
.
Dowód
Oznaczmy
. Wówczas φx(0) = 0,φx'(0) = 0,φx''(0) = 0.
Ustalmy dowolne y > 0. Wówczas zgodnie z twierdzeniem Lagrange'a istnieją takie z,t,w > 0, że:
Na tej samej zasadzie:


. 
Lemat 2
Jeżeli X∼N(0,1), to
Dowód
Dokonujemy podstawienia
:
Teraz całkujemy przez części:


. 
Drugi krok polega na oszacowaniu pewnej wartości:
Niech
będzie funkcją trzykrotnie różniczkowalną taką, że
oraz
.
Rozważamy niezależne zmienne (Gn,k) o rozkładzie normalnym takie, że
oraz D2Gn,k = D2Xn,k.
Wówczas :




![- \frac{f''(x)}{2!}X^2_{n,k}] - E[f(x + G_{n,k}) - f(x) - f'(x)\cdot G_{n,k} - \frac{f''(x)}{2!}G^2_{n,k}]| \leqslant](//upload.wikimedia.org/wikipedia/pl/math/3/a/2/3a27326452ff94b9f6276243fa31c298.png)

.
Przy czym ostatnia nierówność to nierówność trójkąta.
Drugi ze składników daje się na podstawie Lematu 1 oszacować w sposób następujący:

.
Tymczasem
, gdzie G∼N(0,1). W związku z tym (korzystając z Lematu 2):

.
Wobec tego

.
Pierwszy ze składników można natomiast oszacować w sposób następujący:



.
Z kolei szacujemy:
oraz



.
Ostatnia nierówność wynika z Lematu 1.
Zatem
mamy następujące oszacowanie:
- | Ef(x + Xn,k) − Ef(x + Gn,k) |
.
Trzeci krok polega na wielokrotnym zastosowaniu oszacowania uzyskanego powyżej.



.
Rozpatrzmy k-ty z powyższych wyrazów.
Podstawiamy
.
Zmienna Y jest niezależna od Xn,k i Gn,k. Wobec tego:



− Ef(y + Gn,k) | dμY(y)


.
Zatem:




. Pierwszy i ostatni składnik z warunku Lindeberga zbiegają do zera, gdy n dąży do nieskończoności. W związku z tym:
.
Oznacza to, że:

, gdzie G∼N(0,1).
Czwarty krok polega na wyliczenie dystrybuanty granicznej na podstawie powyższych oszacowań.
Weźmy funkcję
spełniającą warunek 
dla pewnych
.
Wówczas:
.
Ale:
oraz
.
W związku z tym:
oraz podobnie

.
Otrzymujemy więc
![P(X_{n,1} + \dots + X_{n,n} \geqslant t) \xrightarrow[n\to \infty]{}](//upload.wikimedia.org/wikipedia/pl/math/8/1/0/810ce8e6b810e39387ec00e96a677c5c.png)
.
Ale z ciągłości dystrybuanty rozkładu normalnego wnioskujemy, że
.
Ponieważ punktowa zbieżność dystrybuant w punktach ciągłości dystrybuanty granicznej jest równoważna zbieżności według rozkładu, więc ostatecznie:
.
[edytuj] Częste nieporozumienia
- Centralne twierdzenie graniczne nie sprawi, by przy dostatecznie dużej próbie rozkład stał się normalny. Jedynie rozkład średniej z tej próby upodabnia się do normalnego.
- Centralne twierdzenie graniczne jest prawdziwe tylko dla rozkładów o skończonej wariancji. Zobacz stabilność struktury.



.







. 







. 



![- \frac{f''(x)}{2!}X^2_{n,k}] - E[f(x + G_{n,k}) - f(x) - f'(x)\cdot G_{n,k} - \frac{f''(x)}{2!}G^2_{n,k}]| \leqslant](http://upload.wikimedia.org/wikipedia/pl/math/3/a/2/3a27326452ff94b9f6276243fa31c298.png)

.
.
.
.

.





.
.


.
.





.
.
, gdzie
.![Ef(X_{n,1} + \dots + X_{n,n}) \xrightarrow[n \to \infty]{} Ef(G)](http://upload.wikimedia.org/wikipedia/pl/math/f/8/d/f8daa491409c53d929ee2804f55dcf1b.png)
.
![\geqslant P(G\geqslant t+\delta) \xrightarrow[\delta \to 0^+]{} P(G\geqslant t)](http://upload.wikimedia.org/wikipedia/pl/math/d/1/d/d1d66edca3adb916f4b46fece7db46f4.png)

.![P(X_{n,1} + \dots + X_{n,n} \geqslant t) \xrightarrow[n\to \infty]{}](http://upload.wikimedia.org/wikipedia/pl/math/8/1/0/810ce8e6b810e39387ec00e96a677c5c.png)
.
.
.