Średnia arytmetyczna

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Średnią arytmetyczną n \, liczb a_1, a_2, ..., a_n \, nazywamy liczbę: \frac{a_1 + a_2 + \cdots + a_n}{n}. Inaczej mówiąc jest to iloraz sumy n liczb i n (gdzie n to liczba sumowanych liczb).

Przykłady zastosowania[edytuj | edytuj kod]

Średnia arytmetyczna jest właśnie tym, co w potocznym języku określa się mianem średniej. Można ją również określić jako średnią potęgową rzędu 1.

Na przykład średnią liczb -5,-3, 0 i 12 jest

\frac{-5+(-3)+0+12}{4}=1.

Średnia arytmetyczna jest jedną z najbardziej intuicyjnych miar oceny populacji, stosowanych często w codziennym życiu – przykładem może być średnia ocen z matematyki ucznia szkoły podstawowej, który otrzymał następujące noty: 2, 4, 4, 5, 6

\frac{2+4+4+5+6}{5}=4{,}2

W podobny sposób można mówić o średniej płacy w danej firmie, średniej cenie pomarańczy na targowiskach w lipcu 2004 roku czy średnim wzroście poborowych w danym roczniku.

Średnia arytmetyczna jest dobrą miarą położenia rozkładu i jednocześnie miarą tendencji centralnej. Jest to miara klasyczna rozkładu, czyli każda zmiana dowolnego elementu badanego zbioru pociąga za sobą zmianę wartości średniej.

Właściwości statystyczne średniej z próby[edytuj | edytuj kod]

Odchylenie standardowe średniej[edytuj | edytuj kod]

Jeśli uśredniamy n \, nieskorelowanych[1] zmiennych o odchyleniach standardowych \sigma_1,\sigma_2,\dots,\sigma_n, to odchylenie ich średniej arytmetycznej jest równe średniej kwadratowej odchyleń tych zmiennych:

\sigma_{\overline{X}}=\sqrt{\frac{\sigma_1^2+\sigma_2^2+\dots+\sigma_n^2}{n}}

Jeśli zmienne są skorelowane, wówczas odchylenie średniej będzie inne, np. dla dwóch zmiennych X_1, X_2 \,:

\sigma_{\overline{X}}=\sqrt{\frac{\sigma_1^2+\sigma_2^2+2\rho_{12}\sigma_1\sigma_2}{2}}

gdzie \rho_{12} \, to współczynnik korelacji między nimi.

W ogólnym przypadku dla n \, skorelowanych zmiennych:

\sigma_{\overline{X}}=\sqrt{\frac{\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}\rho_{ij}\sigma_i\sigma_j}{n}}=\sqrt{\frac{\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}\operatorname{cov}(X_i,X_j)}{n}}

gdzie \operatorname{cov}(X_i,X_j) to kowariancja i-tej i j-tej zmiennej.

Prawo wielkich liczb[edytuj | edytuj kod]

 Osobny artykuł: prawo wielkich liczb.

Niech X \, będzie zmienną losową o skończonej wariancji i wartości oczekiwanej \mu \, oraz niech x_1\dots x_n będzie prostą próbą losową z tej zmiennej. Wtedy dla dowolnie małej dodatniej liczby \varepsilon:

\lim_{n\to\infty} \operatorname{P}\left\{ \mu-\varepsilon\leqslant\frac{x_1+\dots+x_n}{n}\leqslant\mu+\varepsilon\right\} =1

Innymi słowy średnia próbkowa dąży do wartości oczekiwanej w populacji wraz ze wzrostem liczności próby. Prawo wielkich liczb można wzmocnić na dwa sposoby, przedstawione dalej.

Centralne twierdzenie graniczne[edytuj | edytuj kod]

Zgodnie z centralnym twierdzeniem granicznym rozkład średniej z n-elementowej próby wraz ze wzrostem n coraz lepiej odpowiada rozkładowi normalnemu o wartości oczekiwanej \mu \, i odchyleniu \sigma/\sqrt{n}, gdzie \mu \, oraz \sigma\, to odpowiednio wartość oczekiwana oraz odchylenie standardowe w populacji, z której losowana jest próba. Ściślej dla dowolnych liczb rzeczywistych a,b \, takich, że a<b \,:

\operatorname{P}\left\{a\leqslant\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\leqslant b\right\}\to \operatorname{P}\{a\leqslant Z\leqslant  b\}=\Phi(b)-\Phi(a)

gdzie:

Twierdzenie to jest prawdziwe niezależnie od rozkładu w populacji. Właściwość ta jest wykorzystywana w wielu metodach statystycznych i estymatorach. Centralne twierdzenie graniczne jest uogólnieniem prawa wielkich liczb, gdyż opisuje zachowanie całego rozkładu średniej, podczas gdy prawo wielkich liczb opisywało jeden jego parametr (wartość oczekiwaną).

Właściwości średniej jako estymatora[edytuj | edytuj kod]

Średnia arytmetyczna z próby jest, niezależnie od rozkładu, estymatorem zgodnym i nieobciążonym wartości oczekiwanej rozkładu, z którego próba była losowana. Jeśli jest to rozkład normalny, to średnia jest również estymatorem efektywnym.

Ograniczenia[edytuj | edytuj kod]

Średnia arytmetyczna jest podatna na obserwacje odstające (czyli w tym przypadku wartości zmiennej, losowane spoza rozkładu, którego wartość oczekiwaną chcemy estymować, np. pomyłki w danych). W przypadku gdy jest ich dostatecznie dużo, inne średnie, takie jak mediana czy średnia ucinana, mogą dawać lepsze wyniki.

Przypisy

  1. nie muszą być niezależne, wystarcza zerowa wartość współczynnika korelacji Pearsona

Bibliografia[edytuj | edytuj kod]

  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001. ISBN 83-204-2684-7.
  • W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski: Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, część 2. Statystyka matematyczna. Warszawa: PWN, 2006, s. 48. ISBN 83-01-14292-8.

Zobacz też[edytuj | edytuj kod]