Rozkład Skellama

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania
Rozkład Skellama
Funkcja rozkładu prawdopodobieństwa
Przykłady funkcji masy prawdopodobieństwa dla rozkładu Skellama. \> Przykłady funkcji masy prawdopodobieństwa dla rozkładu Skellama. Osią poziomą jest indeks k. (Zauważmy, że funkcja jest zdefiniowana tylko dla wartości całkowitych k. Linie łączące nie wskazują ciągłości).
Parametry \mu_1\ge 0,~~\mu_2\ge 0
Nośnik \{\ldots, -2,-1,0,1,2,\ldots\}
Funkcja rozkładu prawdopodobieństwa e^{-(\mu_1\!+\!\mu_2)}
\left(\frac{\mu_1}{\mu_2}\right)^{k/2}\!\!I_{|k|}(2\sqrt{\mu_1\mu_2})
Dystrybuanta
Wartość oczekiwana (średnia) \mu_1-\mu_2\,
Mediana N/A
Moda
Wariancja \mu_1+\mu_2\,
Współczynnik skośności \frac{\mu_1-\mu_2}{(\mu_1+\mu_2)^{3/2}}
Kurtoza 1/(\mu_1+\mu_2)\,
Entropia
Funkcja generująca momenty e^{-(\mu_1+\mu_2)+\mu_1e^t+\mu_2e^{-t}}
Funkcja charakterystyczna e^{-(\mu_1+\mu_2)+\mu_1e^{it}+\mu_2e^{-it}}
Odkrywca John Gordon Skellam

Rozkład Skellama jest dyskretnym rozkładem prawdopodobieństwa różnicy n_1-n_2 dwóch statystycznie niezależnych zmiennych losowych N_1 and N_2 z których każdy ma rozkład Poissona z różną wartością oczekiwaną \mu_1 and \mu_2. Jest to przydatne w opisie statystyk różnicy dwóch obrazów z prostym szumem śrutowym, a także w opisie rozkładów zakładów finansowych w niektórych sportach jak baseball, hokej i piłka nożna.

Rozkład ma również zastosowanie w szczególnym przypadku różnicy zależnych zmiennych losowych Poissona, ale właśnie oczywisty przypadek gdzie dwie zmienne mają wspólny dodatkowy losowy udział który jest anulowany przez różnicowanie patrz: Karlis i Ntzoufras (2003) gdzie jest więcej informacji i zastosowanie.

Funkcja masy prawdopodobieństwa dla rozkładu Skellama dla różnicy k=n_1-n_2 dwóch zmiennych o rozkładzie Poissona ze środkami \mu_1 i \mu_2 jest dany przez:


  f(k;\mu_1,\mu_2)= e^{-(\mu_1+\mu_2)}
  \left({\mu_1\over\mu_2}\right)^{k/2}I_{|k|}(2\sqrt{\mu_1\mu_2})

gdzie Ik(z) jest zmodyfikowaną funkcją Bessela pierwszego rodzaju.

Pochodna[edytuj | edytuj kod]

Należy zauważyć, że funkcja masy prawdopodobieństwa rozkładu Poissona na n ze średnią μ jest dana przez


f(n;\mu)={\mu^n\over n!}e^{-\mu}.\,

dla n \ge 0 (i zero w przeciwnym wypadku). Funkcja masy prawdopodobieństwa Skellama dla różnicy k=n_1-n_2 jest Korelacją wzajemną dwóch rozkładów Poissona: (Skellam, 1946)


  f(k;\mu_1,\mu_2)
  =\sum_{n=-\infty}^\infty
  \!f(k\!+\!n;\mu_1)f(n;\mu_2)

  =e^{-(\mu_1+\mu_2)}\sum_{n=-\infty}^\infty
  {{\mu_1^{k+n}\mu_2^n}\over{n!( (k+n)!}}

Ponieważ rozkład Poissona ma zero dla ujemnych wartości indeksu, wszystkie człony z ujemnymi silniami powyższej sumy są ustawione na zero. Można wykazać, że powyższe oznacza, że suma

\frac{f(k;\mu_1,\mu_2)}{f(-k;\mu_1,\mu_2)}=\left(\frac{\mu_1}{\mu_2}\right)^k

tak, aby:


  f(k;\mu_1,\mu_2)= e^{-(\mu_1+\mu_2)}
  \left({\mu_1\over\mu_2}\right)^{k/2}I_{|k|}(2\sqrt{\mu_1\mu_2})

gdzie I k(z) jest zmodyfikowaną funkcją Bessela pierwszego rodzaju. Szczególny przypadek dla \mu_1=\mu_2(=\mu) jest podany przez Irwina (1937):


  f\left(k;\mu,\mu\right) = e^{-2\mu}I_{|k|}(2\mu).

Należy również zauważyć że używając granicznych wartości zmodyfikowanej funkcji Bessela dla małych argumentów,możemy odzyskać rozkład Poissona jako szczególny przypadek rozkładu Skellama dla  \mu_2 = 0 .

Właściwości[edytuj | edytuj kod]

Ponieważ jest to dyskretna funkcja prawdopodobieństwa, funkcja masy prawdopodobieństwa Skellama jest znormalizowana:


  \sum_{k=-\infty}^\infty f(k;\mu_1,\mu_2)=1.

Wiemy, że funkcja tworząca prawdopodobieństwa (probability generating function pgf) dla rozkładu Poissona jest:


  G\left(t;\mu\right)= e^{\mu(t-1)}

Wynika stąd, że pgf, G(t;\mu_1,\mu_2) dla funkcji prawdopodobieństwem Skellama będzie:

G(t;\mu_1,\mu_2) = \sum_{k=0}^\infty f(k;\mu_1,\mu_2)t^k
= G\left(t;\mu_1\right)G\left(1/t;\mu_2\right)\,
= e^{-(\mu_1+\mu_2)+\mu_1 t+\mu_2/t}.

Zauważmy że postać funkcji tworzącej prawdopodobieństwa pociąga za sobą to sumy lub różnice dowolnej liczby niezależnych zmienny o rozkładzie Skellama mają również rozkład Skellama. Czasami twierdzi się, że każda kombinacja liniowa dwóch zmiennych o rozkładzie Skellama ma również rozkład Skellama ale wyraźnie nie jest to prawdą, ponieważ jakikolwiek mnożnik różny niż +/-1 zmieni nośnik funkcji rozkładu.

Funkcja tworząca momenty jest dana przez:

M\left(t;\mu_1,\mu_2\right) = G(e^t;\mu_1,\mu_2)
 = \sum_{k=0}^\infty { t^k \over k!}\,m_k

który dostarcza surowe momenty 'mk  Zdefiniujmy:

\Delta\ \stackrel{\mathrm{def}}{=}\ \mu_1-\mu_2\,
\mu\ \stackrel{\mathrm{def}}{=}\ (\mu_1+\mu_2)/2.\,

Wtedy surowe momenty mk

m_1=\left.\Delta\right.\,
m_2=\left.2\mu+\Delta^2\right.\,
m_3=\left.\Delta(1+6\mu+\Delta^2)\right.\,

Momenty centralne M k

M_2=\left.2\mu\right.,\,
M_3=\left.\Delta\right.,\,
M_4=\left.2\mu+12\mu^2\right..\,

Wartość oczekiwana (środek), wariancja, Skośność i kurtoza są odpowiednio:

\left.\right.E(n)=\Delta\,
\sigma^2=\left.2\mu\right.\,
\gamma_1=\left.\Delta/(2\mu)^{3/2}\right.\,
\gamma_2=\left.1/2\mu\right..\,

Funkcja tworząca kumulanty jest dana przez:


  K(t;\mu_1,\mu_2)\ \stackrel{\mathrm{def}}{=}\ \ln(M(t;\mu_1,\mu_2))
  = \sum_{k=0}^\infty { t^k \over k!}\,\kappa_k

która dostarcza kumulanty:

\kappa_{2k}=\left.2\mu\right.
\kappa_{2k+1}=\left.\Delta\right. .

W tym szczególnym przypadku μ1 = μ2 Ekspansja asymptotyczna zmodyfikowanej funkcji Bessela pierwszego rodzaju dostarcza dla dużych μ


  f(k;\mu,\mu)\sim
  {1\over\sqrt{4\pi\mu}}\left[1+\sum_{n=1}^\infty
  (-1)^n{\{4k^2-1^2\}\{4k^2-3^2\}\cdots\{4k^2-(2n-1)^2\}
  \over n!\,2^{3n}\,(2\mu)^n}\right]

(Abramowitz & Stegun 1972, s. 377). Również w tym szczególnym przypadku, gdy 'k jest także duże, i rzędu pierwiastka kwadratowego z 2μ, rozkład zmierza do rozkładu normalnego:


  f(k;\mu,\mu)\sim
  {e^{-k^2/4\mu}\over\sqrt{4\pi\mu}}.

Te szczególne wyniki mogą być łatwo rozszerzone na ogólniejsze przypadki innych sposobów.

Bibliografia[edytuj | edytuj kod]

  • Abramowitz, M. i Stegun, I. A. (Red.) (1972) "Modified Bessel functions I and K". Części 9.6–9.7 w "Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables", 9th printing, s. 374–378. Nowy Jork: Dover.
  • Irwin, J. O. (1937) "The frequency distribution of the difference between two independent variates following the same Poisson distribution." Journal of the Royal Statistical Society: Series A, 100 (3), 415–416. [1]
  • Karlis, D. and Ntzoufras, I. (2003) "Analysis of sports data using bivariate Poisson models". Journal of the Royal Statistical Society: Series D (The Statistician), 52 (3), 381–393. doi:10.1111/1467-9884.00366
  • Karlis D. and Ntzoufras I. (2006). Bayesian analysis of the differences of count data. 'Statistics in Medicine, 25, 1885–1905. [2]
  • Skellam, J. G. (1946) "The frequency distribution of the difference between two Poisson variates belonging to different populations". Journal of the Royal Statistical Society: Series A, 109 (3), 296. [3]