Średnia arytmetyczna

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, szukaj

Średnią arytmetyczną n \, liczb a_1, a_2, ..., a_n \, nazywamy liczbę: \frac{a_1 + a_2 + \cdots + a_n}{n}. Inaczej mówiąc jest to iloraz sumy n liczb i n (gdzie n to ilość sumowanych liczb).

Spis treści

[edytuj] Przykłady zastosowania

Średnia arytmetyczna jest właśnie tym, co w potocznym języku określa się mianem średniej. Można ją również określić jako średnią potęgową rzędu 1.

Na przykład średnią liczb -5,-3, 0 i 12 jest

\frac{-5+(-3)+0+12}{4}=1.

Średnia arytmetyczna jest jedną z najbardziej intuicyjnych miar oceny populacji, stosowanych często w codziennym życiu – przykładem może być średnia ocen z matematyki ucznia szkoły podstawowej, który otrzymał następujące noty: 2, 4, 4, 5, 6

\frac{2+4+4+5+6}{5}=4{,}2

W podobny sposób można mówić o średniej płacy w danej firmie, średniej cenie pomarańczy na targowiskach w lipcu 2004 roku czy średnim wzroście poborowych w danym roczniku.

Średnia arytmetyczna jest dobrą miarą położenia rozkładu i jednocześnie miarą tendencji centralnej. Jest to miara klasyczna rozkładu, czyli każda zmiana dowolnego elementu badanego zbioru pociąga za sobą zmianę wartości średniej.

[edytuj] Właściwości statystyczne średniej z próby

[edytuj] Odchylenie standardowe średniej

Jeśli uśredniamy n \, nieskorelowanych[1] zmiennych o odchyleniach standardowych \sigma_1,\sigma_2,\dots,\sigma_n, to odchylenie ich średniej arytmetycznej jest równe średniej kwadratowej odchyleń tych zmiennych:

\sigma_{\overline{X}}=\sqrt{\frac{\sigma_1^2+\sigma_2^2+\dots+\sigma_n^2}{n}}

Jeśli zmienne są skorelowane, wówczas odchylenie średniej będzie inne, np. dla dwóch zmiennych X_1, X_2 \,:

\sigma_{\overline{X}}=\sqrt{\frac{\sigma_1^2+\sigma_2^2+2\rho_{12}\sigma_1\sigma_2}{2}}

gdzie \rho_{12} \, to współczynnik korelacji między nimi.

W ogólnym przypadku dla n \, skorelowanych zmiennych:

\sigma_{\overline{X}}=\sqrt{\frac{\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}\rho_{ij}\sigma_i\sigma_j}{n}}=\sqrt{\frac{\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}\operatorname{cov}(X_i,X_j)}{n}}

gdzie \operatorname{cov}(X_i,X_j) to kowariancja i-tej i j-tej zmiennej.

[edytuj] Prawo wielkich liczb

Information icon.svg Osobny artykuł: prawo wielkich liczb.

Niech X \, będzie zmienną losową o skończonej wariancji i wartości oczekiwanej \mu \, oraz niech x_1\dots x_n będzie prostą próbą losową z tej zmiennej. Wtedy dla dowolnie małej dodatniej liczby ε:

\lim_{n\to\infty} \operatorname{P}\left\{ \mu-\varepsilon\leqslant\frac{x_1+\dots+x_n}{n}\leqslant\mu+\varepsilon\right\} =1

Innymi słowy średnia próbkowa dąży do wartości oczekiwanej w populacji wraz ze wzrostem liczności próby. Prawo wielkich liczb można wzmocnić na dwa sposoby, przedstawione dalej.

[edytuj] Centralne twierdzenie graniczne

Zgodnie z centralnym twierdzeniem granicznym rozkład średniej z n-elementowej próby wraz ze wzrostem n coraz lepiej odpowiada rozkładowi normalnemu o wartości oczekiwanej \mu \, i odchyleniu \sigma/\sqrt{n}, gdzie \mu \, oraz \sigma\, to odpowiednio wartość oczekiwana oraz odchylenie standardowe w populacji, z której losowana jest próba. Ściślej dla dowolnych liczb rzeczywistych a,b \, takich, że a<b \,:

\operatorname{P}\left\{a\leqslant\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\leqslant b\right\}\to \operatorname{P}\{a\leqslant Z\leqslant  b\}=\Phi(b)-\Phi(a)

gdzie:

Twierdzenie to jest prawdziwe niezależnie od rozkładu w populacji. Właściwość ta jest wykorzystywana w wielu metodach statystycznych i estymatorach. Centralne twierdzenie graniczne jest uogólnieniem prawa wielkich liczb, gdyż opisuje zachowanie całego rozkładu średniej, podczas gdy prawo wielkich liczb opisywało jeden jego parametr (wartość oczekiwaną).

[edytuj] Właściwości średniej jako estymatora

Średnia arytmetyczna z próby jest, niezależnie od rozkładu, estymatorem zgodnym i nieobciążonym wartości oczekiwanej rozkładu, z którego próba była losowana. Jeśli jest to rozkład normalny, to średnia jest również estymatorem efektywnym.

[edytuj] Ograniczenia

Średnia arytmetyczna jest podatna na obserwacje odstające (czyli w tym przypadku wartości zmiennej, losowane spoza rozkładu, którego wartość oczekiwaną chcemy estymować, np. pomyłki w danych). W przypadku gdy jest ich dostatecznie dużo, inne średnie, takie jak mediana czy średnia ucinana, mogą dawać lepsze wyniki.

Przypisy

  1. nie muszą być niezależne, wystarcza zerowa wartość współczynnika korelacji Pearsona

[edytuj] Bibliografia

  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001. ISBN 83-204-2684-7. 
  • W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski: Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, część 2. Statystyka matematyczna. Warszawa: PWN, 2006, s. 48. ISBN 83-01-14292-8. 

[edytuj] Zobacz też

Osobiste
Przestrzenie nazw
Warianty
Działania
Nawigacja
Dla czytelników
Dla wikipedystów
Drukuj lub eksportuj
Narzędzia
W innych językach