Test t Studenta
| Definicja intuicyjna |
| Test t Studenta to test statystyczny sprawdzający, czy różnica między średnimi (lub między średnią a wartością odniesienia) jest na tyle duża, że trudno ją wyjaśnić przypadkową zmiennością danych. |
Test t Studenta – test statystyczny używany do sprawdzania hipotez o wartości średniej danej cechy w populacji lub różnicy między wartościami średnimi w różnych populacjach; badana cecha winna mieć rozkład normalny lub zbliżony do normalnego[1][2]. Jednej z wersji tego testu używa się, gdy chce się sprawdzić, czy średnia w populacji przyjmuje określoną wartość (test t dla jednej średniej). Inna wersja stosowana jest wtedy, gdy należy sprawdzić równość średnich w dwóch niezależnych populacjach (test t dla dwóch średnich). Testu t Studenta używa się także do badania różnic między średnimi na podstawie prób powiązanych (zależnych), czyli takich, w których obserwacje występują w parach (np. pomiar przed i po zastosowaniu jakiegoś działania)[3]. Test t Studenta korzysta ze statystyki testowej o rozkładzie Studenta[1].
Podstawowa idea
[edytuj | edytuj kod]Jeśli próba losowa pochodzi z populacji o rozkładzie normalnym , to średnia z próby również ma rozkład normalny z wartością oczekiwaną i wariancją . Różnica dzielona przez tzw. błąd standardowy średniej (tj. iloraz odchylenia standardowego w populacji i pierwiastka z liczebności próby)
ma standardowy rozkład normalny .
Odchylenie standardowe w populacji nie jest jednak zwykle znane. Postępujemy wtedy następująco: odchylenie zastępujemy odchyleniem standardowym z próby ; uzyskany w ten sposób rozkład t Studenta pozwala oszacować średnią w populacji nawet dla małej liczebności próby [4] (dla próby o większej liczebności dobrze przybliża ; wtedy rozkład t Studenta dobrze przybliża się rozkładem normalnym).
Test t dla jednej średniej
[edytuj | edytuj kod]Założenia: Test ten stosuje się, gdy można założyć, że zmienna losowa opisująca cechę w populacji ma (w przybliżeniu) rozkład normalny . Przy tym ani (średnia) ani (odchylenie standardowe) nie są znane, ale dostępna jest próba losowa pobrana z populacji. W takiej sytuacji można postawić hipotezę dotyczącą wartości i przeprowadzić test weryfikujący tę hipotezę. Sprawdzenie warunku normalności jest szczególnie istotne w przypadku małych prób (np. [5]), ponieważ w próbach o większej liczebności rozkład średniej próby dąży do normalnego (wynika to z centralnego twierdzenia granicznego).
Hipoteza zerowa: Oznaczmy średnią z próby symbolem a odchylenie standardowe z próby – symbolem tj.
gdzie – liczebność próby.
W ramach testu jednej średniej weryfikuje się hipotezę zerową, która zakłada, że prawdziwa średnia w populacji, z której pobierana jest próba o liczebności jest równa pewnej liczbie Jeżeli hipoteza zerowa jest prawdziwa, to statystyka , dana wzorem

ma rozkład Studenta z stopniami swobody.
Uwaga:
Niektórzy autorzy stosują wzór na odchylenie z próby w postaci estymatora[6][7]
gdzie – liczebność próby.
Wtedy statystyka dana jest wzorem
Pomimo tych różnic oba wzory na statystykę są identyczne, co łatwo sprawdzić, wstawiając odpowiednie wyrażenia na / do obu wzorów na .
Hipoteza alternatywna: Hipoteza alternatywna może przyjąć trzy formy[5]:
- prawostronną: (średnia w populacji jest większa niż ),
- lewostronną: (średnia w populacji jest mniejsza niż ),
- dwustronną: (średnia w populacji nie jest równa ).
Obszar krytyczny: Podobnie jak w innych testach weryfikujących hipotezy statystyczne, wyznacza się obszar krytyczny w zależności od formy hipotezy alternatywnej oraz przyjętego poziomu istotności [8][9]:

(1) – dla hipotezy alternatywnej prawostronnej,
(2) – dla hipotezy alternatywnej lewostronnej,
(3) – dla hipotezy alternatywnej dwustronnej,
gdzie , – kwantyle rzędu i rozkładu t Studenta o stopniach swobody.
Kryterium decyzyjne: Jeżeli obliczona z próby wartość statystyki testowej znajdzie się w obszarze krytycznym, to hipoteza zerowa jest odrzucana (analogicznie jest w wielu innych testach statystycznych)[8].
(Równoważnym warunkiem odrzucenia hipotezy zerowej jest przekroczenie przez wartość p przejętego poziomu istotności .)

Przykład 1: Średnia żywotność samochodów
[edytuj | edytuj kod]Weryfikacja hipotezy zerowej za pomocą testu Studenta[7]
W celu zbadania średniego przebiegu samochodu danej marki do czasu generalnego remontu, pobrano próbę losową o liczności ; średni przebieg wyniósł , a odchylenie standardowe z próby . Zakładając, że przebieg samochodu jest zmienną losową o rozkładzie normalnym o nieznanych parametrach przetestuj na poziomie istotności hipotezę zerową (postawioną przez producenta)
- , gdzie
przeciwko hipotezie alternatywnej (alternatywa lewostronna, postawiona przez klienta)
Rozwiązanie:
Statystyka testowa: Test dla średniej przy nieznanym odchyleniu standardowym zmiennej losowej normalnej ma statystykę o rozkładzie t Studenta
Podstawiając dane otrzymamy wartość statystyki testowej z próby
Stopnie swobody:
Wartość krytyczna: Dla testu lewostronnego i poziomu istotności z tablic t Studenta odczytujemy wartość kwantylu , tj.
więc zbiór krytyczny ma postać
Decyzja: Ponieważ
to oznacza, że statystyka jest w obszarze krytycznym; odrzucamy więc hipotezę .
Wniosek: Na poziomie istotności istnieją podstawy do stwierdzenia, że średni przebieg samochodu do momentu jego remontu jest mniejszy niż 150 tys. km.
Test t dla dwóch średnich (próby niezależne)
[edytuj | edytuj kod]Założenia: Test dwóch średnich porównuje średnie z dwóch prób o liczebnościach i pochodzących z dwóch różnych populacji. Zakłada się, że rozkłady w populacjach są w przybliżeniu normalne. Założenie to jest istotne w przypadku małych prób, ponieważ dla większych prób test jest odporny na umiarkowane odstępstwa od tego założenia. Test wymaga ponadto założenia o równości wariancji w obu populacjach.
(Podobny test umożliwiający pominięcie założenia o równości wariancji nazywany jest testem t Welcha.)
Hipoteza zerowa: Hipoteza zerowa zakłada, że różnica pomiędzy średnimi w obu populacjach ma pewną ustaloną wartość, tj. . W praktyce jest zazwyczaj
Hipoteza alternatywna: Hipoteza alternatywna może być, podobnie jak w teście jednej średniej, dwustronna lewostronna () lub prawostronna ().
Statystyka testowa: Statystyka testowa dana jest wzorem[3][10]:
gdzie:
- – średnia i wariancja w pierwszej próbie
- – średnia i wariancja w drugiej próbie
ma rozkład t Studenta o stopniach swobody.
Przykład 2: Różnica w działaniu leków
[edytuj | edytuj kod]Dane z badania:
Grupa 1 (Lek A): pacjentów, średni spadek ciśnienia mmHg, wariancja .
Grupa 2 (Lek B): pacjentów, średni spadek ciśnienia mmHg, wariancja .
Hipoteza zerowa: Testujemy hipotezę, że nie ma różnicy w działaniu leków, tj. . Zakładamy poziom istotności .
Hipoteza alternatywna: Zakładamy, że jest różnica w działaniu leków, tj. (hipoteza dwustronna).
Obliczenia statystyki :
Obliczamy tzw. wariancję połączoną
i wstawiamy do mianownika we wzorze na :
Obliczamy statystykę
Stopnie swobody: .
Wartość krytyczna: Dla poziomu istotności i stopni swobody wartość krytyczna odczytana z tablic t Studenta dla testu dwustronnego wynosi ok. .
Wynik: Ponieważ jest większe niż wartość krytyczna , więc odrzucamy hipotezę o braku różnic.
Wniosek: Lek A działa istotnie statystycznie lepiej niż Lek B.
Test różnicy dwóch średnich (próby zależne)
[edytuj | edytuj kod]Jeżeli obserwacje z dwóch populacji można powiązać w pary (na przykład testujemy zużycie paliwa wylosowanych samochodów w jeździe miejskiej i poza miastem albo umiejętności uczestników szkoleń przed i po szkoleniu), należy obliczyć różnice dla każdej pary i na tak przygotowanych danych (na obliczonych różnicach) przeprowadzić test jednej średniej[3][8].
W teście t-Studenta dla prób zależnych (parowanych) kluczowe wzory opierają się na analizie różnic między parami obserwacji.
Różnica dla każdej pary wyników: Dla każdego pacjenta obliczamy różnicę między wynikiem po badaniu a przed badaniem:
Średnia różnica w próbie:
Odchylenie standardowe różnic: Obliczane analogicznie do klasycznego odchylenia, ale dla wartości różnic
Błąd standardowy średniej różnicy: (SE)
Statystyka testowa: Statystyka Służy do sprawdzenia, czy średnia różnica istotnie odbiega od zakładanego braku różnic:
Stopnie swobody: W teście parowanym liczba stopni swobody wynosi
Przykład 3: Badanie skuteczności działania leku (test parowany)
[edytuj | edytuj kod]Dane z badania:
Liczba pacjentów: (każdy badany dwukrotnie: przed i po podaniu leku).
Średnia różnica w wynikach: mmHg (średnia z indywidualnych spadków ciśnienia u każdego pacjenta).
Odchylenie standardowe różnic: .
Hipoteza zerowa: Założenie, że lek nie wywołuje zmiany ().
Błąd standardowy średniej różnicy (SE):
Statystyka dla prób zależnych:
Stopnie swobody: .
Wartość krytyczna: Dla poziomu istotności i stopni swobody wartość krytyczna tablic t Studenta dla testu dwustronnego wynosi ok. .
Wynik: Ponieważ jest większe niż wartość krytyczna , to odrzucamy hipotezę o braku efektu w działaniu leku.
Wniosek: Lek powoduje istotną statystycznie zmianę ciśnienia.
Tablica kwantylów rozkładu t Studenta
[edytuj | edytuj kod]Tablica zestawia kwantyle rozkładu t Studenta. Pozwala m.in. wyznaczać obszar krytyczny dla testów statystycznych opartych na rozkładzie t Studenta o danej liczbie stopni swobody.
...| kwantyl rozkładu | 0,9 | 0,95 | 0,975 | 0,98 | 0,99 | 0,995 | 0,999 | 0,9995 |
|---|---|---|---|---|---|---|---|---|
| obszar krytyczny jednostronny, | 0,1 | 0,05 | 0,025 | 0,02 | 0,01 | 0,005 | 0,001 | 0,0005 |
| obszar krytyczny dwustronny, | 0,2 | 0,1 | 0,05 | 0,04 | 0,02 | 0,01 | 0,002 | 0,001 |
| (rozkład Cauchy'ego) | 3,07768 | 6,31375 | 12,7062 | 15,8945 | 31,8205 | 63,6568 | 318,306 | 636,627 |
| 2 | 1,88562 | 2,91999 | 4,30265 | 4,84873 | 6,96456 | 9,92484 | 22,3272 | 31,5990 |
| 3 | 1,63774 | 2,35336 | 3,18245 | 3,48191 | 4,54070 | 5,84091 | 10,2145 | 12,9240 |
| 4 | 1,53321 | 2,13185 | 2,77644 | 2,99853 | 3,74695 | 4,60409 | 7,17318 | 8,61031 |
| 5 | 1,47588 | 2,01505 | 2,57058 | 2,75651 | 3,36493 | 4,03214 | 5,89344 | 6,86884 |
| 6 | 1,43976 | 1,94318 | 2,44691 | 2,61224 | 3,14267 | 3,70743 | 5,20763 | 5,95880 |
| 7 | 1,41492 | 1,89458 | 2,36462 | 2,51675 | 2,99795 | 3,49948 | 4,78528 | 5,40787 |
| 8 | 1,39682 | 1,85955 | 2,30600 | 2,44898 | 2,89646 | 3,35539 | 4,50079 | 5,04130 |
| 9 | 1,38303 | 1,83311 | 2,26216 | 2,39844 | 2,82144 | 3,24984 | 4,29681 | 4,78092 |
| 10 | 1,37218 | 1,81246 | 2,22814 | 2,35931 | 2,76377 | 3,16927 | 4,14370 | 4,58691 |
| 11 | 1,36343 | 1,79588 | 2,20099 | 2,32814 | 2,71808 | 3,10581 | 4,02470 | 4,43697 |
| 12 | 1,35622 | 1,78229 | 2,17881 | 2,30272 | 2,68100 | 3,05454 | 3,92963 | 4,31779 |
| 13 | 1,35017 | 1,77093 | 2,16037 | 2,28160 | 2,65031 | 3,01228 | 3,85198 | 4,22083 |
| 14 | 1,34503 | 1,76131 | 2,14479 | 2,26378 | 2,62449 | 2,97684 | 3,78739 | 4,14045 |
| 15 | 1,34061 | 1,75305 | 2,13145 | 2,24854 | 2,60248 | 2,94671 | 3,73283 | 4,07276 |
| 16 | 1,33676 | 1,74588 | 2,11991 | 2,23536 | 2,58349 | 2,92078 | 3,68615 | 4,01500 |
| 17 | 1,33338 | 1,73961 | 2,10982 | 2,22385 | 2,56693 | 2,89823 | 3,64576 | 3,96512 |
| 18 | 1,33039 | 1,73406 | 2,10092 | 2,21370 | 2,55238 | 2,87844 | 3,61048 | 3,92164 |
| 19 | 1,32773 | 1,72913 | 2,09302 | 2,20470 | 2,53948 | 2,86094 | 3,57940 | 3,88341 |
| 20 | 1,32534 | 1,72472 | 2,08596 | 2,19666 | 2,52798 | 2,84534 | 3,55181 | 3,84952 |
| 21 | 1,32319 | 1,72074 | 2,07961 | 2,18943 | 2,51765 | 2,83136 | 3,52715 | 3,81927 |
| 22 | 1,32124 | 1,71714 | 2,07387 | 2,18289 | 2,50832 | 2,81876 | 3,50499 | 3,79214 |
| 23 | 1,31946 | 1,71387 | 2,06866 | 2,17696 | 2,49987 | 2,80734 | 3,48496 | 3,76762 |
| 24 | 1,31784 | 1,71088 | 2,06390 | 2,17154 | 2,49216 | 2,79694 | 3,46678 | 3,74539 |
| 25 | 1,31635 | 1,70814 | 2,05954 | 2,16659 | 2,48511 | 2,78744 | 3,45019 | 3,72514 |
| 26 | 1,31497 | 1,70562 | 2,05553 | 2,16203 | 2,47863 | 2,77871 | 3,43500 | 3,70660 |
| 27 | 1,31370 | 1,70329 | 2,05183 | 2,15783 | 2,47266 | 2,77068 | 3,42103 | 3,68959 |
| 28 | 1,31253 | 1,70113 | 2,04841 | 2,15393 | 2,46714 | 2,76326 | 3,40816 | 3,67391 |
| 29 | 1,31143 | 1,69913 | 2,04523 | 2,15033 | 2,46202 | 2,75639 | 3,39624 | 3,65941 |
| 30 | 1,31041 | 1,69726 | 2,04227 | 2,14697 | 2,45726 | 2,75000 | 3,38519 | 3,64596 |
| (rozkład normalny) | 1,28155 | 1,64485 | 1,95996 | 2,05375 | 2,32635 | 2,57583 | 3,09023 | 3,29053 |
Zobacz też
[edytuj | edytuj kod]- przedział ufności
- regresja liniowa
- rozkład Studenta
- statystyka
- test istotności dla wartości średniej populacji
- test istotności dla dwóch średnich
- test t Welcha
- test dla wariancji
- weryfikacja hipotez statystycznych
Przypisy
[edytuj | edytuj kod]- ↑ a b Kubik i Krupowicz 1982 ↓, s. 255.
- ↑ Student’s t-tests, [w:] Brian Everitt, Anders Skrondal, The Cambridge Dictionary of Statistics, wyd. 4th ed, Cambridge, UK ; New York: Cambridge University Press, 2010, ISBN 978-0-521-76699-9.
- ↑ a b c Andrzej Stanisz, Przystępny kurs statystyki z zastosowaniem Statistica PL na przykładach z medycyny. T. 1: Statystyki podstawowe, Wyd. 3 zm. i popr, Kraków: StatSoft Polska, 2006, s. 224-225, ISBN 978-83-88724-18-3 [dostęp 2024-04-22] (pol.).
- ↑ Jacek Koronacki, Jan Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, s. 201-202, ISBN 978-83-204-3242-8 [dostęp 2024-05-07].
- ↑ a b Anna Baranowska, Elementy statystyki dla studentów uczelni medycznych: nowoczesne ujęcie z opisem obliczeń w programach Excel, R i Statistica, Wydanie drugie poprawione, Wrocław: Oficyna Wydawnicza GiS, 2022, ISBN 978-83-67234-02-3 [dostęp 2024-05-07].
- ↑ Kubik i Krupowicz 1982 ↓, s. 182-182.
- ↑ a b Gajek i Kałuszka 1993 ↓, s. 91.
- ↑ a b c Kubik i Krupowicz 1982 ↓, s. 255-257.
- ↑ Gajek i Kałuszka 1993 ↓, s. 90-91.
- ↑ Gajek i Kałuszka 1993 ↓, s. 100-101.
Bibliografia
[edytuj | edytuj kod]- Lech T. Kubik, Andrzej Krupowicz, Wprowadzenie do rachunku prawdopodobieństwa i jego zastosowań, Warszawa 1982, Państwowe Wydawnictwo Naukowe, str. 255-257 (test t-Studenta)
- Lesław Gajek, Marek Kałuszka, Wnioskowanie statystyczne Modele i metody, Wydawnictwa Naukowo-Techniczne, Warszawa 1993, str. 42-43 (rozkład t Studenta), str. 90-91 (test t Studenta jednej średniej) , str. 99-100 (test t Studenta równości średnich).