Rozkład Skellama

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj
Rozkład Skellama
Funkcja rozkładu prawdopodobieństwa
Przykłady funkcji masy prawdopodobieństwa dla rozkładu Skellama. Osią poziomą jest indeks k. (Zauważmy, że funkcja jest zdefiniowana tylko dla wartości całkowitych k. Linie łączące nie wskazują ciągłości).
Przykłady funkcji masy prawdopodobieństwa dla rozkładu Skellama. Osią poziomą jest indeks k. (Zauważmy, że funkcja jest zdefiniowana tylko dla wartości całkowitych k. Linie łączące nie wskazują ciągłości).
Parametry \mu_1\ge 0,~~\mu_2\ge 0
Nośnik \{\ldots, -2,-1,0,1,2,\ldots\}
Funkcja rozkładu prawdopodobieństwa e^{-(\mu_1\!+\!\mu_2)}
\left(\frac{\mu_1}{\mu_2}\right)^{k/2}\!\!I_{|k|}(2\sqrt{\mu_1\mu_2})
Wartość oczekiwana (średnia) \mu_1-\mu_2\,
Mediana N/A
Wariancja \mu_1+\mu_2\,
Współczynnik skośności \frac{\mu_1-\mu_2}{(\mu_1+\mu_2)^{3/2}}
Kurtoza 1/(\mu_1+\mu_2)\,
Funkcja tworząca momenty e^{-(\mu_1+\mu_2)+\mu_1e^t+\mu_2e^{-t}}
Funkcja charakterystyczna e^{-(\mu_1+\mu_2)+\mu_1e^{it}+\mu_2e^{-it}}
Odkrywca John Gordon Skellam

Rozkład Skellama jest dyskretnym rozkładem prawdopodobieństwa różnicy n_1-n_2 dwóch statystycznie niezależnych zmiennych losowych N_1 and N_2 z których każdy ma rozkład Poissona z różną wartością oczekiwaną \mu_1 and \mu_2. Jest to przydatne w opisie statystyk różnicy dwóch obrazów z prostym szumem śrutowym, a także w opisie rozkładów zakładów finansowych w niektórych sportach jak baseball, hokej i piłka nożna.

Rozkład ma również zastosowanie w szczególnym przypadku różnicy zależnych zmiennych losowych Poissona, ale właśnie oczywisty przypadek gdzie dwie zmienne mają wspólny dodatkowy losowy udział który jest anulowany przez różnicowanie patrz: Karlis i Ntzoufras (2003) gdzie jest więcej informacji i zastosowanie.

Funkcja masy prawdopodobieństwa dla rozkładu Skellama dla różnicy k=n_1-n_2 dwóch zmiennych o rozkładzie Poissona ze środkami \mu_1 i \mu_2 jest dany przez:


  f(k;\mu_1,\mu_2)= e^{-(\mu_1+\mu_2)}
  \left({\mu_1\over\mu_2}\right)^{k/2}I_{|k|}(2\sqrt{\mu_1\mu_2})

gdzie Ik(z) jest zmodyfikowaną funkcją Bessela pierwszego rodzaju.

Pochodna[edytuj | edytuj kod]

Należy zauważyć, że funkcja masy prawdopodobieństwa rozkładu Poissona na n ze średnią μ jest dana przez


f(n;\mu)={\mu^n\over n!}e^{-\mu}.\,

dla n \ge 0 (i zero w przeciwnym wypadku). Funkcja masy prawdopodobieństwa Skellama dla różnicy k=n_1-n_2 jest Korelacją wzajemną dwóch rozkładów Poissona: (Skellam, 1946)


  f(k;\mu_1,\mu_2)
  =\sum_{n=-\infty}^\infty
  \!f(k\!+\!n;\mu_1)f(n;\mu_2)

  =e^{-(\mu_1+\mu_2)}\sum_{n=-\infty}^\infty
  {{\mu_1^{k+n}\mu_2^n}\over{n!( (k+n)!}}

Ponieważ rozkład Poissona ma zero dla ujemnych wartości indeksu, wszystkie człony z ujemnymi silniami powyższej sumy są ustawione na zero. Można wykazać, że powyższe oznacza, że suma

\frac{f(k;\mu_1,\mu_2)}{f(-k;\mu_1,\mu_2)}=\left(\frac{\mu_1}{\mu_2}\right)^k

tak, aby:


  f(k;\mu_1,\mu_2)= e^{-(\mu_1+\mu_2)}
  \left({\mu_1\over\mu_2}\right)^{k/2}I_{|k|}(2\sqrt{\mu_1\mu_2})

gdzie I k(z) jest zmodyfikowaną funkcją Bessela pierwszego rodzaju. Szczególny przypadek dla \mu_1=\mu_2(=\mu) jest podany przez Irwina (1937):


  f\left(k;\mu,\mu\right) = e^{-2\mu}I_{|k|}(2\mu).

Należy również zauważyć że używając granicznych wartości zmodyfikowanej funkcji Bessela dla małych argumentów,możemy odzyskać rozkład Poissona jako szczególny przypadek rozkładu Skellama dla  \mu_2 = 0 .

Właściwości[edytuj | edytuj kod]

Ponieważ jest to dyskretna funkcja prawdopodobieństwa, funkcja masy prawdopodobieństwa Skellama jest znormalizowana:


  \sum_{k=-\infty}^\infty f(k;\mu_1,\mu_2)=1.

Wiemy, że funkcja tworząca prawdopodobieństwa (probability generating function pgf) dla rozkładu Poissona jest:


  G\left(t;\mu\right)= e^{\mu(t-1)}

Wynika stąd, że pgf, G(t;\mu_1,\mu_2) dla funkcji prawdopodobieństwem Skellama będzie:

G(t;\mu_1,\mu_2) = \sum_{k=0}^\infty f(k;\mu_1,\mu_2)t^k
= G\left(t;\mu_1\right)G\left(1/t;\mu_2\right)\,
= e^{-(\mu_1+\mu_2)+\mu_1 t+\mu_2/t}.

Zauważmy że postać funkcji tworzącej prawdopodobieństwa pociąga za sobą to sumy lub różnice dowolnej liczby niezależnych zmienny o rozkładzie Skellama mają również rozkład Skellama. Czasami twierdzi się, że każda kombinacja liniowa dwóch zmiennych o rozkładzie Skellama ma również rozkład Skellama ale wyraźnie nie jest to prawdą, ponieważ jakikolwiek mnożnik różny niż +/-1 zmieni nośnik funkcji rozkładu.

Funkcja tworząca momenty jest dana przez:

M\left(t;\mu_1,\mu_2\right) = G(e^t;\mu_1,\mu_2)
 = \sum_{k=0}^\infty { t^k \over k!}\,m_k

który dostarcza surowe momenty 'mk  Zdefiniujmy:

\Delta\ \stackrel{\mathrm{def}}{=}\ \mu_1-\mu_2\,
\mu\ \stackrel{\mathrm{def}}{=}\ (\mu_1+\mu_2)/2.\,

Wtedy surowe momenty mk

m_1=\left.\Delta\right.\,
m_2=\left.2\mu+\Delta^2\right.\,
m_3=\left.\Delta(1+6\mu+\Delta^2)\right.\,

Momenty centralne M k

M_2=\left.2\mu\right.,\,
M_3=\left.\Delta\right.,\,
M_4=\left.2\mu+12\mu^2\right..\,

Wartość oczekiwana (środek), wariancja, Skośność i kurtoza są odpowiednio:

\left.\right.E(n)=\Delta\,
\sigma^2=\left.2\mu\right.\,
\gamma_1=\left.\Delta/(2\mu)^{3/2}\right.\,
\gamma_2=\left.1/2\mu\right..\,

Funkcja tworząca kumulanty jest dana przez:


  K(t;\mu_1,\mu_2)\ \stackrel{\mathrm{def}}{=}\ \ln(M(t;\mu_1,\mu_2))
  = \sum_{k=0}^\infty { t^k \over k!}\,\kappa_k

która dostarcza kumulanty:

\kappa_{2k}=\left.2\mu\right.
\kappa_{2k+1}=\left.\Delta\right. .

W tym szczególnym przypadku μ1 = μ2 Ekspansja asymptotyczna zmodyfikowanej funkcji Bessela pierwszego rodzaju dostarcza dla dużych μ


  f(k;\mu,\mu)\sim
  {1\over\sqrt{4\pi\mu}}\left[1+\sum_{n=1}^\infty
  (-1)^n{\{4k^2-1^2\}\{4k^2-3^2\}\cdots\{4k^2-(2n-1)^2\}
  \over n!\,2^{3n}\,(2\mu)^n}\right]

(Abramowitz & Stegun 1972, s. 377). Również w tym szczególnym przypadku, gdy 'k jest także duże, i rzędu pierwiastka kwadratowego z 2μ, rozkład zmierza do rozkładu normalnego:


  f(k;\mu,\mu)\sim
  {e^{-k^2/4\mu}\over\sqrt{4\pi\mu}}.

Te szczególne wyniki mogą być łatwo rozszerzone na ogólniejsze przypadki innych sposobów.

Bibliografia[edytuj | edytuj kod]

  • Abramowitz, M. i Stegun, I. A. (Red.) (1972) "Modified Bessel functions I and K". Części 9.6–9.7 w "Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables", 9th printing, s. 374–378. Nowy Jork: Dover.
  • Irwin, J. O. (1937) "The frequency distribution of the difference between two independent variates following the same Poisson distribution." Journal of the Royal Statistical Society: Series A, 100 (3), 415–416. [1]
  • Karlis, D. and Ntzoufras, I. (2003) "Analysis of sports data using bivariate Poisson models". Journal of the Royal Statistical Society: Series D (The Statistician), 52 (3), 381–393. doi:10.1111/1467-9884.00366
  • Karlis D. and Ntzoufras I. (2006). Bayesian analysis of the differences of count data. 'Statistics in Medicine, 25, 1885–1905. [2]
  • Skellam, J. G. (1946) "The frequency distribution of the difference between two Poisson variates belonging to different populations". Journal of the Royal Statistical Society: Series A, 109 (3), 296. [3]