Przejdź do zawartości

Test t Studenta

Z Wikipedii, wolnej encyklopedii
Definicja intuicyjna
Test t Studenta to test statystyczny sprawdzający, czy różnica między średnimi (lub między średnią a wartością odniesienia) jest na tyle duża, że trudno ją wyjaśnić przypadkową zmiennością danych.

Test t Studentatest statystyczny używany do sprawdzania hipotez o wartości średniej danej cechy w populacji lub różnicy między wartościami średnimi w różnych populacjach; badana cecha winna mieć rozkład normalny lub zbliżony do normalnego[1][2]. Jednej z wersji tego testu używa się, gdy chce się sprawdzić, czy średnia w populacji przyjmuje określoną wartość (test t dla jednej średniej). Inna wersja stosowana jest wtedy, gdy należy sprawdzić równość średnich w dwóch niezależnych populacjach (test t dla dwóch średnich). Testu t Studenta używa się także do badania różnic między średnimi na podstawie prób powiązanych (zależnych), czyli takich, w których obserwacje występują w parach (np. pomiar przed i po zastosowaniu jakiegoś działania)[3]. Test t Studenta korzysta ze statystyki testowej o rozkładzie Studenta[1].

Podstawowa idea

[edytuj | edytuj kod]

Jeśli próba losowa pochodzi z populacji o rozkładzie normalnym , to średnia z próby również ma rozkład normalny z wartością oczekiwaną i wariancją . Różnica dzielona przez tzw. błąd standardowy średniej (tj. iloraz odchylenia standardowego w populacji i pierwiastka z liczebności próby)

ma standardowy rozkład normalny .

Odchylenie standardowe w populacji nie jest jednak zwykle znane. Postępujemy wtedy następująco: odchylenie zastępujemy odchyleniem standardowym z próby ; uzyskany w ten sposób rozkład t Studenta pozwala oszacować średnią w populacji nawet dla małej liczebności próby [4] (dla próby o większej liczebności dobrze przybliża ; wtedy rozkład t Studenta dobrze przybliża się rozkładem normalnym).

Test t dla jednej średniej

[edytuj | edytuj kod]

Założenia: Test ten stosuje się, gdy można założyć, że zmienna losowa opisująca cechę w populacji ma (w przybliżeniu) rozkład normalny . Przy tym ani (średnia) ani (odchylenie standardowe) nie są znane, ale dostępna jest próba losowa pobrana z populacji. W takiej sytuacji można postawić hipotezę dotyczącą wartości i przeprowadzić test weryfikujący tę hipotezę. Sprawdzenie warunku normalności jest szczególnie istotne w przypadku małych prób (np. [5]), ponieważ w próbach o większej liczebności rozkład średniej próby dąży do normalnego (wynika to z centralnego twierdzenia granicznego).

Hipoteza zerowa: Oznaczmy średnią z próby symbolem a odchylenie standardowe z próby – symbolem tj.

gdzie – liczebność próby.

W ramach testu jednej średniej weryfikuje się hipotezę zerową, która zakłada, że prawdziwa średnia w populacji, z której pobierana jest próba o liczebności jest równa pewnej liczbie Jeżeli hipoteza zerowa jest prawdziwa, to statystyka , dana wzorem

Funkcja gęstości rozkładu t-Studenta z stopniami swobody. Czerwona strefa pokazuje obszar krytyczny dla hipotezy alternatywnej prawostronnej przy poziomie istotności . Lewy koniec przedziału krytycznego odczytuje się z tablic rozkładu t Studenta jako wartość kwantylu .

ma rozkład Studenta z stopniami swobody.

Uwaga:

Niektórzy autorzy stosują wzór na odchylenie z próby w postaci estymatora[6][7]

gdzie – liczebność próby.

Wtedy statystyka dana jest wzorem

Pomimo tych różnic oba wzory na statystykę są identyczne, co łatwo sprawdzić, wstawiając odpowiednie wyrażenia na / do obu wzorów na .

Hipoteza alternatywna: Hipoteza alternatywna może przyjąć trzy formy[5]:

  • prawostronną: (średnia w populacji jest większa niż ),
  • lewostronną: (średnia w populacji jest mniejsza niż ),
  • dwustronną: (średnia w populacji nie jest równa ).

Obszar krytyczny: Podobnie jak w innych testach weryfikujących hipotezy statystyczne, wyznacza się obszar krytyczny w zależności od formy hipotezy alternatywnej oraz przyjętego poziomu istotności [8][9]:

Funkcja gęstości rozkładu t-Studenta z stopniami swobody. Czerwona strefa pokazuje obszar krytyczny dla hipotezy alternatywnej lewostronnej przy poziomie istotności . Prawy koniec przedziału krytycznego wyznacza się następująco: odczytuje się z tablic rozkładu t Studenta wartość kwantylu i bierze się liczbę przeciwną .

(1) – dla hipotezy alternatywnej prawostronnej,

(2) – dla hipotezy alternatywnej lewostronnej,

(3) – dla hipotezy alternatywnej dwustronnej,

gdzie , kwantyle rzędu i rozkładu t Studenta o stopniach swobody.

Kryterium decyzyjne: Jeżeli obliczona z próby wartość statystyki testowej znajdzie się w obszarze krytycznym, to hipoteza zerowa jest odrzucana (analogicznie jest w wielu innych testach statystycznych)[8].

(Równoważnym warunkiem odrzucenia hipotezy zerowej jest przekroczenie przez wartość p przejętego poziomu istotności .)

Funkcja gęstości rozkładu t Studenta z stopniami swobody. Czerwone obszary pokazują obszar krytyczny dla hipotezy alternatywnej obustronnej przy poziomie istotności . Lewy koniec prawego podprzedziału krytycznego odczytuje się z tablic rozkładu t Studenta jako wartość kwantylu . Prawy koniec lewego podprzedziału jest liczbą przeciwną do wyżej określonego, tj. ma wartość .

Przykład 1: Średnia żywotność samochodów

[edytuj | edytuj kod]

Weryfikacja hipotezy zerowej za pomocą testu Studenta[7]

W celu zbadania średniego przebiegu samochodu danej marki do czasu generalnego remontu, pobrano próbę losową o liczności ; średni przebieg wyniósł , a odchylenie standardowe z próby . Zakładając, że przebieg samochodu jest zmienną losową o rozkładzie normalnym o nieznanych parametrach przetestuj na poziomie istotności hipotezę zerową (postawioną przez producenta)

, gdzie

przeciwko hipotezie alternatywnej (alternatywa lewostronna, postawiona przez klienta)

Rozwiązanie:

Statystyka testowa: Test dla średniej przy nieznanym odchyleniu standardowym zmiennej losowej normalnej ma statystykę o rozkładzie t Studenta

Podstawiając dane otrzymamy wartość statystyki testowej z próby

Stopnie swobody:

Wartość krytyczna: Dla testu lewostronnego i poziomu istotności z tablic t Studenta odczytujemy wartość kwantylu , tj.

więc zbiór krytyczny ma postać

Decyzja: Ponieważ

to oznacza, że statystyka jest w obszarze krytycznym; odrzucamy więc hipotezę .

Wniosek: Na poziomie istotności istnieją podstawy do stwierdzenia, że średni przebieg samochodu do momentu jego remontu jest mniejszy niż 150 tys. km.

Test t dla dwóch średnich (próby niezależne)

[edytuj | edytuj kod]

Założenia: Test dwóch średnich porównuje średnie z dwóch prób o liczebnościach i pochodzących z dwóch różnych populacji. Zakłada się, że rozkłady w populacjach są w przybliżeniu normalne. Założenie to jest istotne w przypadku małych prób, ponieważ dla większych prób test jest odporny na umiarkowane odstępstwa od tego założenia. Test wymaga ponadto założenia o równości wariancji w obu populacjach.

(Podobny test umożliwiający pominięcie założenia o równości wariancji nazywany jest testem t Welcha.)

Hipoteza zerowa: Hipoteza zerowa zakłada, że różnica pomiędzy średnimi w obu populacjach ma pewną ustaloną wartość, tj. . W praktyce jest zazwyczaj

Hipoteza alternatywna: Hipoteza alternatywna może być, podobnie jak w teście jednej średniej, dwustronna lewostronna () lub prawostronna ().

Statystyka testowa: Statystyka testowa dana jest wzorem[3][10]:

gdzie:

  • – średnia i wariancja w pierwszej próbie
  • – średnia i wariancja w drugiej próbie

ma rozkład t Studenta o stopniach swobody.

Przykład 2: Różnica w działaniu leków

[edytuj | edytuj kod]

Dane z badania:

Grupa 1 (Lek A): pacjentów, średni spadek ciśnienia mmHg, wariancja .

Grupa 2 (Lek B): pacjentów, średni spadek ciśnienia mmHg, wariancja .

Hipoteza zerowa: Testujemy hipotezę, że nie ma różnicy w działaniu leków, tj. . Zakładamy poziom istotności .

Hipoteza alternatywna: Zakładamy, że jest różnica w działaniu leków, tj. (hipoteza dwustronna).

Obliczenia statystyki :

Obliczamy tzw. wariancję połączoną

i wstawiamy do mianownika we wzorze na :

Obliczamy statystykę

Stopnie swobody: .

Wartość krytyczna: Dla poziomu istotności i stopni swobody wartość krytyczna odczytana z tablic t Studenta dla testu dwustronnego wynosi ok. .

Wynik: Ponieważ jest większe niż wartość krytyczna , więc odrzucamy hipotezę o braku różnic.

Wniosek: Lek A działa istotnie statystycznie lepiej niż Lek B.

Test różnicy dwóch średnich (próby zależne)

[edytuj | edytuj kod]

Jeżeli obserwacje z dwóch populacji można powiązać w pary (na przykład testujemy zużycie paliwa wylosowanych samochodów w jeździe miejskiej i poza miastem albo umiejętności uczestników szkoleń przed i po szkoleniu), należy obliczyć różnice dla każdej pary i na tak przygotowanych danych (na obliczonych różnicach) przeprowadzić test jednej średniej[3][8].

W teście t-Studenta dla prób zależnych (parowanych) kluczowe wzory opierają się na analizie różnic między parami obserwacji.

Różnica dla każdej pary wyników: Dla każdego pacjenta obliczamy różnicę między wynikiem po badaniu a przed badaniem:

Średnia różnica w próbie:

Odchylenie standardowe różnic: Obliczane analogicznie do klasycznego odchylenia, ale dla wartości różnic

Błąd standardowy średniej różnicy: (SE)

Statystyka testowa: Statystyka Służy do sprawdzenia, czy średnia różnica istotnie odbiega od zakładanego braku różnic:

Stopnie swobody: W teście parowanym liczba stopni swobody wynosi

Przykład 3: Badanie skuteczności działania leku (test parowany)

[edytuj | edytuj kod]

Dane z badania:

Liczba pacjentów: (każdy badany dwukrotnie: przed i po podaniu leku).

Średnia różnica w wynikach: mmHg (średnia z indywidualnych spadków ciśnienia u każdego pacjenta).

Odchylenie standardowe różnic: .

Hipoteza zerowa: Założenie, że lek nie wywołuje zmiany ().

Błąd standardowy średniej różnicy (SE):

Statystyka dla prób zależnych:

Stopnie swobody: .

Wartość krytyczna: Dla poziomu istotności i stopni swobody wartość krytyczna tablic t Studenta dla testu dwustronnego wynosi ok. .

Wynik: Ponieważ jest większe niż wartość krytyczna , to odrzucamy hipotezę o braku efektu w działaniu leku.

Wniosek: Lek powoduje istotną statystycznie zmianę ciśnienia.

Tablica kwantylów rozkładu t Studenta

[edytuj | edytuj kod]

Tablica zestawia kwantyle rozkładu t Studenta. Pozwala m.in. wyznaczać obszar krytyczny dla testów statystycznych opartych na rozkładzie t Studenta o danej liczbie stopni swobody.

...
kwantyl rozkładu 0,9 0,95 0,975 0,98 0,99 0,995 0,999 0,9995
obszar krytyczny jednostronny, 0,1 0,05 0,025 0,02 0,01 0,005 0,001 0,0005
obszar krytyczny dwustronny, 0,2 0,1 0,05 0,04 0,02 0,01 0,002 0,001
(rozkład Cauchy'ego) 3,07768 6,31375 12,7062 15,8945 31,8205 63,6568 318,306 636,627
2 1,88562 2,91999 4,30265 4,84873 6,96456 9,92484 22,3272 31,5990
3 1,63774 2,35336 3,18245 3,48191 4,54070 5,84091 10,2145 12,9240
4 1,53321 2,13185 2,77644 2,99853 3,74695 4,60409 7,17318 8,61031
5 1,47588 2,01505 2,57058 2,75651 3,36493 4,03214 5,89344 6,86884
6 1,43976 1,94318 2,44691 2,61224 3,14267 3,70743 5,20763 5,95880
7 1,41492 1,89458 2,36462 2,51675 2,99795 3,49948 4,78528 5,40787
8 1,39682 1,85955 2,30600 2,44898 2,89646 3,35539 4,50079 5,04130
9 1,38303 1,83311 2,26216 2,39844 2,82144 3,24984 4,29681 4,78092
10 1,37218 1,81246 2,22814 2,35931 2,76377 3,16927 4,14370 4,58691
11 1,36343 1,79588 2,20099 2,32814 2,71808 3,10581 4,02470 4,43697
12 1,35622 1,78229 2,17881 2,30272 2,68100 3,05454 3,92963 4,31779
13 1,35017 1,77093 2,16037 2,28160 2,65031 3,01228 3,85198 4,22083
14 1,34503 1,76131 2,14479 2,26378 2,62449 2,97684 3,78739 4,14045
15 1,34061 1,75305 2,13145 2,24854 2,60248 2,94671 3,73283 4,07276
16 1,33676 1,74588 2,11991 2,23536 2,58349 2,92078 3,68615 4,01500
17 1,33338 1,73961 2,10982 2,22385 2,56693 2,89823 3,64576 3,96512
18 1,33039 1,73406 2,10092 2,21370 2,55238 2,87844 3,61048 3,92164
19 1,32773 1,72913 2,09302 2,20470 2,53948 2,86094 3,57940 3,88341
20 1,32534 1,72472 2,08596 2,19666 2,52798 2,84534 3,55181 3,84952
21 1,32319 1,72074 2,07961 2,18943 2,51765 2,83136 3,52715 3,81927
22 1,32124 1,71714 2,07387 2,18289 2,50832 2,81876 3,50499 3,79214
23 1,31946 1,71387 2,06866 2,17696 2,49987 2,80734 3,48496 3,76762
24 1,31784 1,71088 2,06390 2,17154 2,49216 2,79694 3,46678 3,74539
25 1,31635 1,70814 2,05954 2,16659 2,48511 2,78744 3,45019 3,72514
26 1,31497 1,70562 2,05553 2,16203 2,47863 2,77871 3,43500 3,70660
27 1,31370 1,70329 2,05183 2,15783 2,47266 2,77068 3,42103 3,68959
28 1,31253 1,70113 2,04841 2,15393 2,46714 2,76326 3,40816 3,67391
29 1,31143 1,69913 2,04523 2,15033 2,46202 2,75639 3,39624 3,65941
30 1,31041 1,69726 2,04227 2,14697 2,45726 2,75000 3,38519 3,64596
(rozkład normalny) 1,28155 1,64485 1,95996 2,05375 2,32635 2,57583 3,09023 3,29053

Zobacz też

[edytuj | edytuj kod]


Przypisy

[edytuj | edytuj kod]
  1. a b Kubik i Krupowicz 1982 ↓, s. 255.
  2. Student’s t-tests, [w:] Brian Everitt, Anders Skrondal, The Cambridge Dictionary of Statistics, wyd. 4th ed, Cambridge, UK ; New York: Cambridge University Press, 2010, ISBN 978-0-521-76699-9.
  3. a b c Andrzej Stanisz, Przystępny kurs statystyki z zastosowaniem Statistica PL na przykładach z medycyny. T. 1: Statystyki podstawowe, Wyd. 3 zm. i popr, Kraków: StatSoft Polska, 2006, s. 224-225, ISBN 978-83-88724-18-3 [dostęp 2024-04-22] (pol.).
  4. Jacek Koronacki, Jan Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, s. 201-202, ISBN 978-83-204-3242-8 [dostęp 2024-05-07].
  5. a b Anna Baranowska, Elementy statystyki dla studentów uczelni medycznych: nowoczesne ujęcie z opisem obliczeń w programach Excel, R i Statistica, Wydanie drugie poprawione, Wrocław: Oficyna Wydawnicza GiS, 2022, ISBN 978-83-67234-02-3 [dostęp 2024-05-07].
  6. Kubik i Krupowicz 1982 ↓, s. 182-182.
  7. a b Gajek i Kałuszka 1993 ↓, s. 91.
  8. a b c Kubik i Krupowicz 1982 ↓, s. 255-257.
  9. Gajek i Kałuszka 1993 ↓, s. 90-91.
  10. Gajek i Kałuszka 1993 ↓, s. 100-101.

Bibliografia

[edytuj | edytuj kod]
  • Lech T. Kubik, Andrzej Krupowicz, Wprowadzenie do rachunku prawdopodobieństwa i jego zastosowań, Warszawa 1982, Państwowe Wydawnictwo Naukowe, str. 255-257 (test t-Studenta)
  • Lesław Gajek, Marek Kałuszka, Wnioskowanie statystyczne Modele i metody, Wydawnictwa Naukowo-Techniczne, Warszawa 1993, str. 42-43 (rozkład t Studenta), str. 90-91 (test t Studenta jednej średniej) , str. 99-100 (test t Studenta równości średnich).