Błąd z próby

Błąd z próby (inaczej błąd losowy, ang. sampling error) – pojęcie z zakresu statystyki, oznaczające wielkość błędu jaki pojawi się w czasie szacowania wartości zmiennej w populacji na podstawie wartości tej zmiennej w próbie wylosowanej z tej populacji. Błąd z próby szacuje się uwzględniając 3 czynniki: (szacowany) parametr populacji, błąd standardowy oraz wielkość próby.

Określając błąd z próby zawsze należy podać dwie liczby: poziom ufności oraz przedział ufności.

Przykład zastosowania[edytuj | edytuj kod]

Chcemy oszacować jaki procent Polaków cierpi na różnego rodzaju alergie. Przebadanie wszystkich Polaków jest niewykonalne, ale możemy oszacować parametr populacji (w tym przypadku odsetek alergików w populacji) na podstawie odsetka alergików w losowo dobranej próbie 1600 Polaków. Załóżmy, że w próbie dokładnie 50% osób stwierdziło, że cierpi na alergię. Błąd z próby obliczamy następująco:

Krok 1: Określamy jaki poziom ufności chcemy zastosować np. 68%, 95% czy 99,9%.

Krok 2: Obliczamy błąd standardowy.

Błąd standardowy wyniósł 1,25% i został wyliczony ze wzoru: błąd standardowy = √(p*q):n=√(50*50):1600=√2500:1600=√1,5625=1,25,

gdzie p to proporcja alergików w próbie (50%), proporcja osób nie będących alergikami w próbie q=1-p (100%-50%=50%), zaś n to wielkość próby (1600 osób).

Krok 3: Wyznaczamy przedział ufności. To, jaki będzie przedział ufności jest zdeterminowane przez wybrany nas wcześniej poziom ufności (czy wybraliśmy 68%, 95% czy 99,9%) oraz przez wielkość błędu standardowego.

Z rachunku prawdopodobieństwa wiemy, że prawdziwa wielkość w populacji nie różni się od wyniku w próbie:

a) o więcej niż plus minus 1 błąd standardowy przy założeniu 68% poziomu ufności,

b) o więcej niż plus minus 2 błędy standardowe przy założeniu 95% poziomu ufności,

c) o więcej niż plus minus 3 błędy standardowe przy założeniu 99,9% poziomu ufności.

Wybraliśmy 95-procentowy poziom ufności. To oznacza plus minus 2 błędy standardowe od wartości w próbie (odsetek alergików 50%).

W związku z tym przedział ufności będzie wynosił od 47,5% do 52,5%.

Krok 4. Podajemy oszacowanie błędu z próby: Jeśli dokładnie 50% osób w próbie stwierdzi, że cierpi na alergię, to możemy stwierdzić, że z 95%-procentową pewnością (poziom ufności) odsetek alergików w całej populacji Polaków mieści się w przedziale od 47,5% do 52,5% (przedział ufności).

Bibliografia[edytuj | edytuj kod]

Earl Babbie: Badania społeczne w praktyce. Warszawa: Wydawnictwo Naukowe PWN, 2007, s. 496 i 624.