Statystyka (funkcja)

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Statystyka to funkcja mierzalna określona na przestrzeni statystycznej, służąca do wyodrębnienia pewnych istotnych cech danych doświadczalnych. Jest szczególnym przypadkiem miary rozkładu. Pojęcie statystyki w statystyce matematycznej jest odpowiednikiem zmiennej losowej w rachunku prawdopodobieństwa[1].

Statystyki są często estymatorami parametrów rozkładu zmiennej losowej w populacji generalnej

Definicja[edytuj | edytuj kod]

Niech  ( \Omega, \mathcal{F}, \mathcal{P} ) będzie przestrzenią statystyczną, gdzie

\mathcal{P}=\{P_\theta \colon \theta \in \Theta\}

jest rodziną miar probabilistycznych określonych na σ-ciele  \mathcal{F} podzbiorów zbioru  \Omega , indeksowaną parametrem \theta\;. Niech dalej  ( \mathcal{X}, \mathcal{C} ) będzie przestrzenią mierzalną. Funkcję mierzalną  T \colon \Omega \to \mathcal{X} nazywamy statystyką. Zbiór  \Omega jest nazywany przestrzenią prób.

Uwagi[edytuj | edytuj kod]

  • Jeśli  \mathcal{X} = \mathbb{R} to statystykę  T nazywamy statystyką o wartościach rzeczywistych.
  • Jeśli  \mathcal{X} = \mathbb{R}^n to statystykę  T nazywamy statystyką o wartościach wektorowych.

Przykłady[edytuj | edytuj kod]

Statystyka swobodna[edytuj | edytuj kod]

Statystyka T \colon \Omega \to \mathbb{R}\; jest statystyką swobodną ze względu na wartość oczekiwaną, gdy  E_{P_\theta} (T) istnieje i nie zależy od \theta\;. Wspólną dla  \theta \in \Theta wartość oczekiwaną oznaczamy  E(T) i nazywamy wartością oczekiwaną statystyki  T .

Statystyka dostateczna[edytuj | edytuj kod]

Definicja i własności[edytuj | edytuj kod]

σ-ciało dostateczne

σ-podciało  \mathcal{G} σ-ciała  \mathcal{F} jest dostateczne, gdy dla każdego  F \in \mathcal{F} istnieje wersja prawdopodobieństwa warunkowego  P( F | \mathcal{G} ) taka sama dla wszystkich miar z rodziny  \mathcal{P} .

Statystyka dostateczna

Statystykę T nazywamy dostateczną jeżeli σ-podciało  T^{-1} (\mathcal{C}) jest dostateczne.

Twierdzenie

Niech statystyka  T \colon ( \R^n, \mathcal{B}_{R^n}, \mathcal{P} ) \to ( \mathbb{R}^n, \mathcal{B}_{R^n} ) będzie statystyką o wartościach wektorowych.  T jest statystyką dostateczną dla rodziny \mathcal{P} lub dla \theta\; jeżeli dla każdej wartości t\; rozkład warunkowy P_\theta\{\cdot |T=t\} nie zależy od \theta\;.

Przypadek ogólny opisuje poniższe twierdzenie (zwane twierdzeniem o faktoryzacji lub twierdzeniem Neymana):

Twierdzenie

Niech  ( \Omega, \mathcal{F}, \{ p_\theta : \theta \in \Theta \} ) będzie przestrzenią statystyczną dominowaną. Statystyka T: \Omega \to \mathcal{X} \; jest dostateczna wtedy i tylko wtedy, gdy funkcje gęstości p_\theta\; dają się przedstawić w postaci:

 \bigwedge\limits_{\omega \in \Omega} p_\theta(\omega)=g_\theta(T(\omega))h(\omega)\;

gdzie  h \colon \Omega \to [0; \infty ) jest funkcją  \mathcal{F} -mierzalną, funkcje  g_\theta \colon \mathcal{X} \to [ 0; \infty )  \mathcal{C} -mierzalne.

Minimalna statystyka dostateczna[edytuj | edytuj kod]

Statystykę dostateczną S\; nazywamy minimalną statystyką dostateczną jeżeli dla każdej statystyki dostatecznej T\; istnieje funkcja H taka, że S=H(T)\;.

Zobacz też[edytuj | edytuj kod]

WiktionaryPl nodesc.svg
Zobacz hasło statystyka w Wikisłowniku

Przypisy

  1. J.R. Barra Matematyczne podstawy statystyki, s. 11-12

Bibliografia[edytuj | edytuj kod]

  • Jean René Barra, Elżbieta Pleszczyńska, Maria Wesołowska: Matematyczne podstawy statystyki. Warszawa: Państwowe Wydawnictwo Naukowe, 1982. ISBN 83-01-02847-5.
  • Ryszard Zieliński: Siedem wykładów wprowadzających do statystyki matematycznej. Warszawa: 2004. http://www.impan.gov.pl/~rziel/7ALL.pdf (dostęp: 21 maja 2008)