Średnia arytmetyczna

Średnia arytmetyczna – suma liczb podzielona przez ich liczbę.

Dla $n$ liczb $a_{1},a_{2},\dots ,a_{n}$ jest to więc wyrażenie^[1]:

{\frac {a_{1}+a_{2}+\ldots +a_{n}}{n}}.

W języku potocznym średnią arytmetyczną określa się po prostu jako średnią.

Na przykład średnią czterech liczb, –5, –3, 0 i 12, jest

{\frac {-5+(-3)+0+12}{4}}=1.

Średnia arytmetyczna jest szczególnym przypadkiem średniej potęgowej rzędu 1.

Zastosowania[edytuj | edytuj kod]

Średnia arytmetyczna jest jedną z najbardziej intuicyjnych miar oceny populacji, stosowanych często w codziennym życiu – przykładami mogą być średnia ocen z jakiegoś przedmiotu, średnia płaca w firmie, średnia cena pomarańczy na targowiskach w lipcu 2004 roku czy średni wzrost poborowych w danym roczniku.

Średnia arytmetyczna jest dobrą miarą położenia rozkładu i jednocześnie miarą tendencji centralnej. Jest to miara klasyczna rozkładu, czyli każda zmiana dowolnego elementu badanego zbioru pociąga za sobą zmianę wartości średniej.

Właściwości statystyczne średniej z próby[edytuj | edytuj kod]

Odchylenie standardowe średniej[edytuj | edytuj kod]

Jeśli uśredniamy $n$ nieskorelowanych^[a] zmiennych o odchyleniach standardowych $\sigma _{1},\sigma _{2},\dots ,\sigma _{n},$ to odchylenie ich średniej arytmetycznej jest równe średniej kwadratowej odchyleń tych zmiennych:

\sigma _{\overline {X}}={\sqrt {\frac {\sigma _{1}^{2}+\sigma _{2}^{2}+\ldots +\sigma _{n}^{2}}{n}}}.

Jeśli zmienne są skorelowane, wówczas odchylenie średniej będzie inne, np. dla dwóch zmiennych $X_{1},X_{2}{:}$

\sigma _{\overline {X}}={\sqrt {\frac {\sigma _{1}^{2}+\sigma _{2}^{2}+2\rho _{12}\sigma _{1}\sigma _{2}}{2}}},

gdzie $\rho _{12}$ to współczynnik korelacji między nimi.

W ogólnym przypadku dla $n$ skorelowanych zmiennych:

\sigma _{\overline {X}}={\sqrt {\frac {\sum \limits _{i=1}^{n}\sum \limits _{j=1}^{n}\rho _{ij}\sigma _{i}\sigma _{j}}{n}}}={\sqrt {\frac {\sum \limits _{i=1}^{n}\sum \limits _{j=1}^{n}\operatorname {cov} (X_{i},X_{j})}{n}}},

gdzie $\operatorname {cov} (X_{i},X_{j})$ to kowariancja $i$ -tej i $j$ -tej zmiennej.

Prawo wielkich liczb[edytuj | edytuj kod]

Osobny artykuł: prawo wielkich liczb.

Niech $X$ będzie zmienną losową o skończonej wariancji i wartości oczekiwanej $\mu$ oraz niech $x_{1}\dots x_{n}$ będzie prostą próbą losową z tej zmiennej. Prawdopodobieństwo, że średnia będzie oszacowana precyzyjnie (znajdzie się nie dalej od prawdziwej wartości niż o dowolnie mały dodatni błąd $\varepsilon$ ) dąży do 100% wraz ze wzrostem próby:

\lim _{n\to \infty }\operatorname {P} \left\{\mu -\varepsilon \leqslant {\frac {x_{1}+\ldots +x_{n}}{n}}\leqslant \mu +\varepsilon \right\}=1.

Innymi słowy średnia próbkowa dąży do wartości oczekiwanej w populacji wraz ze wzrostem liczności próby. Prawo wielkich liczb można wzmocnić na dwa sposoby, przedstawione dalej.

Centralne twierdzenie graniczne[edytuj | edytuj kod]

Osobny artykuł: centralne twierdzenie graniczne.

Zgodnie z centralnym twierdzeniem granicznym rozkład średniej z $n$ -elementowej próby wraz ze wzrostem $n$ coraz lepiej odpowiada rozkładowi normalnemu o wartości oczekiwanej $\mu$ i odchyleniu $\sigma /{\sqrt {n}},$ gdzie $\mu$ oraz $\sigma$ to odpowiednio wartość oczekiwana oraz odchylenie standardowe w populacji, z której losowana jest próba. Ściślej dla dowolnych liczb rzeczywistych $a,b$ takich, że $a<b{:}$

\operatorname {P} \left\{a\leqslant {\frac {{\overline {X}}-\mu }{\sigma /{\sqrt {n}}}}\leqslant b\right\}\to \operatorname {P} \{a\leqslant Z\leqslant b\}=\Phi (b)-\Phi (a),

gdzie:

$Z$ to zmienna o standardowym rozkładzie normalnym (o wartości oczekiwanej zero i wariancji równej jeden),
$\Phi (x)$ to dystrybuanta rozkładu normalnego $N(0,1).$

Twierdzenie to jest prawdziwe niezależnie od rozkładu w populacji. Właściwość ta jest wykorzystywana w wielu metodach statystycznych i estymatorach. Centralne twierdzenie graniczne jest uogólnieniem prawa wielkich liczb, gdyż opisuje zachowanie całego rozkładu średniej, podczas gdy prawo wielkich liczb opisywało jeden jego parametr (wartość oczekiwaną).

Właściwości średniej jako estymatora[edytuj | edytuj kod]

Średnia arytmetyczna z próby jest, niezależnie od rozkładu, estymatorem zgodnym i nieobciążonym wartości oczekiwanej rozkładu, z którego próba była losowana. Jeśli jest to rozkład normalny, to średnia jest również estymatorem efektywnym.

Ograniczenia[edytuj | edytuj kod]

Średnia arytmetyczna jest podatna na skośność rozkładu i obserwacje odstające. W takiej sytuacji inne średnie, takie jak mediana, czy statystyki odpornościowe, np. średnia ucinana lub metody z regularyzacją, mogą dawać lepsze wyniki^[2]^[3].

Nierówność Jensena oznacza, że funkcja średnich ma inną wartość niż średnia tej funkcji.

Zobacz też[edytuj | edytuj kod]

Uwagi[edytuj | edytuj kod]

↑ Nie muszą być niezależne, wystarcza zerowa wartość współczynnika korelacji Pearsona.

Przypisy[edytuj | edytuj kod]

↑ średnia arytmetyczna, [w:] Encyklopedia PWN [dostęp 2021-10-01] .
↑ Jeffrey N.J.N. Rouder Jeffrey N.J.N., JasonJ. Dana JasonJ., Clintin P.C.P. Davis-Stober Clintin P.C.P., Estimation accuracy in the psychological sciences, „PLOS One”, 13 (11), 2018, e0207239, DOI: 10.1371/journal.pone.0207239, ISSN 1932-6203, PMID: 30475810, PMCID: PMC6261010 [dostęp 2019-04-05] (ang.).
↑ Andy P.A.P. Field Andy P.A.P., Rand R.R.R. Wilcox Rand R.R.R., Robust statistical methods: A primer for clinical psychology and experimental psychopathology researchers, „Behaviour Research and Therapy”, 98, 2017, s. 19–38, DOI: 10.1016/j.brat.2017.05.013 [dostęp 2019-04-05] (ang.).

Bibliografia[edytuj | edytuj kod]

Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2001. ISBN 83-204-2684-7.
W. Krysicki, J. Bartos, W. Dyczka, K. Królikowska, M. Wasilewski: Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach, część 2. Statystyka matematyczna. Warszawa: PWN, 2006, s. 48. ISBN 83-01-14292-8.

[2] Nie muszą być niezależne, wystarcza zerowa wartość współczynnika korelacji Pearsona.

[epwn-1] średnia arytmetyczna, [w:] Encyklopedia PWN [dostęp 2021-10-01] .

[3] Jeffrey N.J.N. Rouder Jeffrey N.J.N., JasonJ. Dana JasonJ., Clintin P.C.P. Davis-Stober Clintin P.C.P., Estimation accuracy in the psychological sciences, „PLOS One”, 13 (11), 2018, e0207239, DOI: 10.1371/journal.pone.0207239, ISSN 1932-6203, PMID: 30475810, PMCID: PMC6261010 [dostęp 2019-04-05] (ang.).

[4] Andy P.A.P. Field Andy P.A.P., Rand R.R.R. Wilcox Rand R.R.R., Robust statistical methods: A primer for clinical psychology and experimental psychopathology researchers, „Behaviour Research and Therapy”, 98, 2017, s. 19–38, DOI: 10.1016/j.brat.2017.05.013 [dostęp 2019-04-05] (ang.).

[1]

[a]

[2]

[3]