Rozkład Hotellinga

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Statystyka T² Hotellinga[1] – uogólnienie rozkładu Studenta, który jest używany do testowania hipotez wielowymiarowych. Nazwa pochodzi od Harolda Hotellinga.

Statystyka Hotellinga jest definiowana jako:

,

gdzie n jest liczbą obserwacji, jest p-wymiarową kolumną wektorową, a jest macierzą kowariancji.

Jeśli jest zmienną losową z wielowymiarowego rozkładu Gaussa i (niezależne od x) ma rozkład Wisharta z taką samą macierzą wariancji oraz z , wówczas rozkład jest , rozkładem T² Hotellinga z parametrami p i m. Można pokazać, że:

,

gdzie jest Rozkładem F Snedecora.

Teraz załóżmy, że

jest p×1 kolumną wektorową, której wartościami są liczby rzeczywiste. Załóżmy, że

są ich średnią. Niech p×p będzie macierzą dodatnie określoną

jest macierzą "przykładowych wariancji". (Transpozycja jakiejkolwiek mcierzy M jest oznaczona jako M′). Niech μ będzie znanym p×1 wektorem. Wówczas statystyka Hotellinga przyjmuje postać:

Warto zauważyć, że jest blisko powiązona z kwadratem odległością Mahalanobisa.

W szczególności mże to być pokazane poprzez:[2] Jeśli , są niezależne, i i są jak zdefiniowano powyżej, wówczas ma rozkład Wisharta z n − 1 stopniami swobody

i jest niezależna od , oraz

To oznacza, że:

Statystyka T² Hotellinga dla dwóch prób[edytuj]

Jeśli oraz , są próbkami niezależnymi wyciągniętymi z dwóch niezależnych wielowymiarowych rozkładów Gaussa o takiej samej średniej oraz kowariancji, i definiujemy

jako średnie próbek, oraz

jako estymator nieobciążonej macierzy kowariancji, wówczas Statystyka T² Hotellinga dla dwóch prób wygląda tak:

i może być przedstawiona w postaci rozkładu F-Snedecora:

[2]

Zobacz też[edytuj]

Przypisy

  1. H. Hotelling (1931) The generalization of Student's ratio, Ann. Math. Statist., Vol. 2, pp 360–378.
  2. a b K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis, Academic Press.