Nierówność Rao-Craméra
Twierdzenie Rao-Craméra (zwane również nierównością Rao-Craméra lub nierównościa informacyjną) podaje jaki jest minimalny możliwy średniokwadratowy błąd estymatora (nie ma estymatorów, które miałyby mniejszy średni błąd kwadratowy).
W swojej najprostszej postaci nierówność stwierdza, że wariancja estymatora nieobciążonego jest nie mniejsza niż odwrotność informacji Fishera.
Następujące sformułowania nierówności wymienione są od najprostszej do bardziej ogólnej wersji. Wszystkie sformułowania wymagaja pewnych warunków regularności spełnianych przez wiele "porządnych" rozkładow prawdopodobieństwa. Warunki te wymienione są poniżej.
Spis treści |
Parametr skalarny, przypadek nieobciążony [edytuj]
Załóżmy, że
jest nieznanym deterministycznym parameterem, który jest estymowany przy pomocy obserwacji
z rozkładu prawdopodobieństwa o gęstości
. Wariancja dowolnego nieobciążonego estymatora
parametru
jest wtedy ograniczona z dołu przez odwrotność informacji Fishera
:
.
Przypomnijmy że informacja Fishera
jest dana przez
Wtedy efektywność estymatora nieobciążonego
jest zdefiniowana jako
czyli minimalna możliwa wariancja estymatora nieobciążonego podzielona przez rzeczywistą wariancję. Zatem na mocy twierdzenia mamy że 
Parametr skalarny, przypadek ogólny [edytuj]
Bardziej ogólna postać ograniczenia może być otrzymana przez rozważanie nieobciążonego estymatora
funkcji
parametru
. Nieobiążoność rozumiemy w tym przypadku jako:
. Ograniczenie przyjmuje postać
gdzie
jest pochodną
, i
jest informacją Fishera zdefiniowaną powyżej.
Podobnie możemy otrzymać ograniczenie wariancji estymatora obciążonego z danym obciażeniem. Rozważmy estymator
z obciążeniem
, i niech
. Na mocy powyższego wyniku, dowolny nieobciążony estymator o wartości oczekiwanej
ma wariancję większą lub rowną
. Zatem dowolny esymator
o obciążeniu danym funkcją
spełnia
Oczywiście, nieobciążona wersja ograniczenia jest szczególnym przypadkiem z
.
Przypadek wielowymiarowy [edytuj]
Aby rozszerzyć nierowność Rao-Cramera na przypadek wielowymiarowy, zdefiniujmy wektor parametrów
z funkcją gęstości prawdopodobieństwa
spełniającą dwa warunki regularności ponizej.
Macierz informacji Fishera jest
macierzą dla której element
jest zdefiniowany jako
Niech
będzie estymatorem dowolnej funkcji wektorowej parametrów,
, i oznaczmy jego wektor wartości oczekiwanej
przez
. Wtedy nierówność Rao-Craméra stwierdza że macierz kowariancji dla
spełnia
gdzie
- nierówność macierzy
oznacza że macierz
jest nieujemnie określona,
jest macierza dla której
th element jest dany przez
.
Jeśli
nieobciążonym estymatorem
(to znaczy,
), wtedy nierówność Rao-Craméra sprowadza się do
Warunki regularności [edytuj]
Następujące dwa słabe warunki regularności gęstości prawdopodobieństwa
i estimatora
są konieczne:
- Informacja Fishera jest zawsze zdefiniowana; równoważnie
takie że
,
-
- istnieje i jest skończone.
- Operacje calkowania po
i rózniczkowania ze względu na
są przemienne; to znaczy,
-
- wszędzie gdzie prawa strona jest skończona.
.![I(\theta) =n
\mathrm{E}
\left[
\left[
\frac{\partial}{\partial \theta} \ln f(X;\theta)
\right]^2
\right].](http://upload.wikimedia.org/math/6/7/7/677279d0a4a186d33a025a06759653d9.png)

![\mathrm{var}(T)
\geqslant
\frac{[\psi'(\theta)]^2}{I(\theta)}](http://upload.wikimedia.org/math/c/4/a/c4a13c8542d03f50f8de4af7253cc4a5.png)
![\mathrm{var} \left(\hat{\theta}\right)
\geqslant
\frac{[1+b'(\theta)]^2}{I(\theta)}.](http://upload.wikimedia.org/math/5/2/1/5211b4e6fe26d722cd3265237043fc53.png)
![\boldsymbol{\theta} = \left[ \theta_1, \theta_2, \dots, \theta_d \right]^T \in \mathbb{R}^d](http://upload.wikimedia.org/math/a/f/0/af0944ad16c1d8594eb93b44ff582568.png)
![I_{m, k}
= \mathrm{E} \left[
\frac{d}{d\theta_m} \ln f\left(x; \boldsymbol{\theta}\right)
\frac{d}{d\theta_k} \ln f\left(x; \boldsymbol{\theta}\right)
\right].](http://upload.wikimedia.org/math/7/3/3/73325be1cba54c6936a5943272399a57.png)
![\mathrm{cov}_{\boldsymbol{\theta}}\left(\boldsymbol{T}(X)\right)
\geqslant
\frac
{\partial \boldsymbol{\psi} \left(\boldsymbol{\theta}\right)}
{\partial \boldsymbol{\theta}}
[I\left(\boldsymbol{\theta}\right)]^{-1}
\left(
\frac
{\partial \boldsymbol{\psi}\left(\boldsymbol{\theta}\right)}
{\partial \boldsymbol{\theta}}
\right)^T](http://upload.wikimedia.org/math/e/6/0/e602db04b50d02847925bbf6db46b221.png)
oznacza że macierz
jest
jest macierza dla której
th element jest dany przez
.
,
![\frac{\partial}{\partial\theta}
\left[
\int T(x) f(x;\theta) \,dx
\right]
=
\int T(x)
\left[
\frac{\partial}{\partial\theta} f(x;\theta)
\right]
\,dx](http://upload.wikimedia.org/math/5/c/b/5cb7f5b7531809bf154687fe9a8d4d7b.png)