Kurtoza

Z Wikipedii, wolnej encyklopedii
Przykład kurtozy - inf. przy legendzie podano w języku japońskim

Kurtoza (z gr. κυρτός, kyrtos, kurtoswydęty) – jedna z miar kształtu rozkładu wartości cechy statystycznej. W praktyce definiuje się ją najczęściej w formie tzw. kurtozy nadwyżkowej (współczynnika ekscesu, ang. excess kurtosis)[1]:

gdzie:

– czwarty moment centralny,
odchylenie standardowe.

Interpretacja[edytuj | edytuj kod]

Klasyczny współczynnik kurtozy definiowany jest jako standaryzowany moment centralny czwartego rzędu:

Kurtoza nadwyżkowa (inaczej współczynnik ekscesu lub po prostu eksces: ) jest jednak wygodniejsza, gdyż:

  • kurtoza nadwyżkowa rozkładu normalnego wynosi 0,
  • jeśli jest sumą niezależnych zmiennych losowych, każdej o rozkładzie identycznym z rozkładem zmiennej losowej zachodzi własność:

Wbrew stwierdzeniom obecnym w niektórych podręcznikach, kurtoza nie mierzy „spłaszczenia”, „wysmukłości” ani „spiczastości” rozkładu. Na kurtozę ma wpływ intensywność występowania wartości skrajnych, mierzy więc ona, co się dzieje w „ogonach” rozkładu, natomiast kształt „czubka” rozkładu jest praktycznie bez znaczenia[1][2].

Rozkłady prawdopodobieństwa można podzielić ze względu na wartość kurtozy na rozkłady:

  • mezokurtyczne (KurtE = 0) – wartość kurtozy nadwyżkowej wynosi 0, intensywność wartości skrajnych jest podobna do intensywności wartości skrajnych rozkładu normalnego (dla którego kurtoza nadwyżkowa wynosi dokładnie 0),
  • leptokurtyczne (KurtE > 0) – kurtoza nadwyżkowa jest dodatnia, intensywność wartości skrajnych jest większa niż dla rozkładu normalnego („ogony” rozkładu są „grubsze”),
  • platykurtyczne (KurtE < 0) – kurtoza nadwyżkowa jest ujemna, intensywność wartości skrajnych jest mniejsza niż w przypadku rozkładu normalnego („ogony” rozkładu są „węższe”).

Kurtoza nadwyżkowa z próby wyraża się wzorem:

gdzie:

-ta wartość cechy,
wartość oczekiwana w populacji,
odchylenie standardowe w populacji,
– liczebność próby.

Powyższa statystyka jest obciążonym estymatorem kurtozy nadwyżkowej z populacji, estymator nieobciążony wyraża się wzorem:

gdzie:

– średnia z próby,
odchylenie standardowe z próby,
– kolejne wartości cechy,
– liczebność próby.

Obliczenie kurtozy dla rozkładu normalnego[edytuj | edytuj kod]

Dowód[edytuj | edytuj kod]

Niech:

– moment centralny n–tego rzędu,
– moment zwykły n–tego rzędu,
Dystrybuanta rozkładu normalnego oraz gęstość prawdopodobieństwa rozkładu normalnego to odpowiednio:

Wiadomo, że w rozkładzie normalnym:

Mamy:

a)
b)

Obliczamy momenty zwykłe:























Obliczone wartości:

podstawiamy do wzoru na czwarty moment centralny z punktu b):

Stąd kurtoza jest równa:

Zobacz też[edytuj | edytuj kod]

Przypisy[edytuj | edytuj kod]

  1. a b Błażej Kochański, Czy kurtoza mierzy spiczastość rozkładu?, „Wiadomości Statystyczne. The Polish Statistician”, 67 (11), 2022, s. 43–61, DOI10.5604/01.3001.0016.1039, ISSN 2543-8476 [dostęp 2023-04-19].
  2. Peter H. WESTFALL, Kurtosis as Peakedness, 1905 – 2014. R.I.P., „The American statistician”, 68 (3), 2014, s. 191–195, DOI10.1080/00031305.2014.917055, ISSN 0003-1305, PMID25678714, PMCIDPMC4321753 [dostęp 2021-03-15].