Metryka probabilistyczna

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Metryka probabilistycznafunkcja definiująca odległość pomiędzy zmiennymi bądź wektorami losowymi. Funkcja ta nie jest, jak sugeruje nazwa, metryką, gdyż nie spełnia jej pierwszego aksjomatu, jakim jest identyczność przedmiotów nierozróżnialnych. Należy jednak zauważyć, że funkcja ta jest metryką w przestrzeni probabilistycznej, co więcej, jest to metryka wyznaczona przez normę tej przestrzeni.

Zmienne losowe[edytuj | edytuj kod]

Metryka probabilistyczna D pomiędzy dwiema zmiennymi losowymi X i Y o ciągłych rozkładach gęstości prawdopodobieństwa jest zdefiniowana jako:

D(X, Y) = \int\limits_{-\infty}^\infty \int\limits_{-\infty}^\infty |x-y|F(x, y) \, dx\, dy,

gdzie F(x, y) oznacza łączną gęstość prawdopodobieństwa zmiennych losowych X i Y. Jeżeli X i Yniezależne, to:

D(X, Y) = \int\limits_{-\infty}^\infty \int\limits_{-\infty}^\infty |x-y|f(x)g(y) \, dx\, dy

gdzie f i g oznaczają odpowiednie funkcje gęstości prawdopodobieństwa zmiennych X i Y.

W przypadku dyskretnych zmiennych losowych metryka probabilistyczna przyjmuje postać:

D(X, Y) = \sum_{i} \sum_{j} |x_i-y_j|P(X=x_i)P(Y=y_j)\,.

Można wykazać, że taka metryka probabilistyczna nie spełnia pierwszego warunku metryki, lub też spełnia go wtedy i tylko wtedy, jeżeli oba jej argumenty to zmienne pewne opisywane funkcją gęstości prawdopodobieństwa typu delty Diraca. W takim przypadku:

D_{\delta\delta}(X, Y) = \int\limits_{-\infty}^\infty \int\limits_{-\infty}^\infty |x-y|\delta(x-\mu_x)\delta(y-\mu_y) \, dx\, dy = |\mu_x-\mu_y|

metryka probabilistyczna zwyczajnie staje się metryką pomiędzy wartościami średnimi \mu_x, \mu_y zmiennych X i Y i:

D_{\delta\delta}(X, X) = \int\limits_{-\infty}^\infty \int\limits_{-\infty}^\infty |x-x'|\delta(x-\mu_x)\delta(x'-\mu_x) \, dx\, dx' = |\mu_x-\mu_x| = 0.

We wszystkich pozostałych przypadkach:

D\left(X, X\right) > 0.

MP spełnia pozostałe aksjomaty metryki: jest symetryczna bezpośrednio z definicji i spełnia nierówność trójkąta:

\begin{align}
&{} D(X, Z) = \int_{-\infty}^\infty \int_{-\infty}^\infty |x-z|f(x)h(z) \, dx\, dz\ = \int_{-\infty}^\infty \int_{-\infty}^\infty |x-z|f(x)h(z) \, dx\, dz \int_{-\infty}^\infty g(y) dy\ = \\
&{} = \int_{-\infty}^\infty \int_{-\infty}^\infty \int_{-\infty}^\infty |(x-y)+(y-z)|f(x)g(y)h(z) \, dx\, dy\, dz\ \le \\ 
&{} \le \int_{-\infty}^\infty \int_{-\infty}^\infty \int_{-\infty}^\infty (|x-y|+|y-z|)f(x)g(y)h(z) \, dx\, dy\, dz\ = \\
&{} = \int_{-\infty}^\infty \int_{-\infty}^\infty \int_{-\infty}^\infty |x-y|f(x)g(y)h(z) \, dx\, dy\, dz\ + \int_{-\infty}^\infty \int_{-\infty}^\infty \int_{-\infty}^\infty |y-z|f(x)g(y)h(z) \, dx\, dy\, dz\ = \\
&{} = \int_{-\infty}^\infty \int_{-\infty}^\infty |x-y|f(x)g(y) \, dx\, dy\ + \int_{-\infty}^\infty \int_{-\infty}^\infty |y-z|g(y)h(z) \, dy\, dz\ = \\
&{} = D(X, Y) + D(Y, Z)
\end{align}

Zatem:


D(X, Z) \le D(X, Y)+D(Y, Z)

\left( \int_{-\infty}^\infty f(x) dx\ = \int_{-\infty}^\infty g(y) dy\ = \int_{-\infty}^\infty h(z) dz\ = 1\right)

Metryka probabilistyczna pomiędzy dwiema zmiennymi losowymi X i Y o normalnych rozkładach gęstości prawdopodobieństwa i tym samym odchyleniu standardowym \sigma = 0; \sigma = 0,2; \sigma = 0,4; \sigma = 0,6; \sigma = 0,8; \sigma = 1 (poczynając od krzywej u dołu). m_{xy} = |\mu_x-\mu_y| oznacza odległość pomiędzy wartościami oczekiwanymi zmiennych X i Y.

Przykłady[edytuj | edytuj kod]

Załóżmy, że mamy zmierzyć odległość pomiędzy punktem \mu_{x}\, a punktem \mu_{y}\,, a punkty te są współliniowe z pewnym punktem 0\,.

Załóżmy dalej, że pomiary odległości pomiędzy 0\, a \mu_{x}\, i pomiędzy 0\, a \mu_{y}\, zostały dokonane przez dwie niezależne grupy eksperymentatorów z użyciem taśmy mierniczej.

Przy powyższych założeniach pomiary każdej z grup eksperymentatorów można traktować jako zmienne losowe X\, i Y\, skupione wokół faktycznych położeń punktów odpowiednio \mu_{x}\, i \mu_{y}\,.

Zakładając dalej, że oba rozkłady zmiennych losowych X\, i Y\,normalne (N) a ich odchylenie standardowe \sigma\, jest to samo, całkowanie D\left(X, Y\right)\, prowadzi do:


D_{NN}(X, Y) = \mu_{xy} + \tfrac{2\sigma}{\sqrt\pi}\operatorname{exp}\left(-\frac{\mu_{xy}^2}{4\sigma^2}\right)-\mu_{xy} \operatorname{erfc} \left(\frac{\mu_{xy}}{2\sigma}\right),

gdzie:

\mu_{xy} = \left|\mu_x-\mu_y\right|,

a \operatorname{erfc}(x) jest uzupełniająca funkcją błędu.

W tym przypadku „wartość zerowa” metryki D_{NN}(X, Y)\, wynosi:

\lim_{\mu_{xy}\to 0} D_{NN}(X, Y) = D_{NN}(X, X) = \frac{2\sigma}{\sqrt\pi},

co oznacza, że w sensie statystycznym odległość pomiędzy tą samą zmienną losową X\, jest niezerowa i zależy wyłącznie od typu jej rozkładu i stopnia jego rozproszenia.

Gdy obie zmienne X\, i Y\, określa rozkład jednostajny (R) o tym samym odchyleniu standardowym \sigma\,, całkowanie D\left(X, Y\right)\, prowadzi do:

D_{RR}(X, Y) = \begin{cases} \frac{24\sqrt{3}\sigma^3-\mu_{xy}^3+6\sqrt{3}\sigma\mu_{xy}^2}{36\sigma^2}, & \mu_{xy}<2\sqrt{3}\sigma \\ \mu_{xy}, & \mu_{xy} \geqslant 2\sqrt{3}\sigma \end{cases}

Minimalna wartość metryki probabilistycznej tego typu wynosi:

D_{RR}(X, X) = \tfrac{2\sigma}{\sqrt 3}.

Dla dwóch dyskretnych zmiennych losowych X i Y mających rozkład Poissona metryka probabilistyczna przyjmuje postać:

D_{PP}(X, Y) = \sum_{x=0}^n\sum_{y=0}^n |x-y|\frac{{\lambda_x}^x{\lambda_y}^ye^{-(\lambda_x+\lambda_y)}}{x!y!}.

Wektory losowe[edytuj | edytuj kod]

powierzchnia równej odległości dla metryki euklidesowej d^2(\mathbf x, \mathbf 0), \left(\mathbf{x,0}\right) \in \mathbb R^2
powierzchnia równej odległości dla euklidesowej metryki probabilistycznej D_{R\delta}^2(\mathbf X, \mathbf 0), \left(\mathbf{X,0}\right)\colon \Omega \to \mathbb R^2

Metrykę probabilistyczną zmiennych losowych można rozszerzyć na metrykę D(\mathbf X, \mathbf Y) wektorów losowych \mathbf X, \mathbf Y podstawiając w miejsce |x-y| dowolny operator metryki d(\mathbf x, \mathbf y):

D(\mathbf X, \mathbf Y) =\int\limits_\Omega \int\limits_\Omega d(\mathbf x, \mathbf y)F(\mathbf x, \mathbf y) \, d\Omega_x \, d\Omega_y

gdzie F(\mathbf X, \mathbf Y)\, oznacza łączną gęstość prawdopodobieństwa wektorów losowych \mathbf X\, i \mathbf Y\,. Na przykład podstawiając w miejsce d(\mathbf x, \mathbf y)\, metrykę euklidesową i przy założeniu, że wektory \mathbf X\, i \mathbf Y\, są wzajemnie niezależne otrzymamy:

D(\mathbf{X}, \mathbf{Y}) =\int\limits_\Omega \int\limits_\Omega \sqrt{\sum_i|x_i-y_i|^2} F(\mathbf x)G(\mathbf y) \, d\Omega_x \, d \Omega_y

gdzie F(\mathbf x)\, i G(\mathbf y)\, to wielowymiarowe rozkłady gęstości prawdopodobieństwa wektorów np. wielowymiarowe rozkłady normalne.

Forma euklidesowa[edytuj | edytuj kod]

Jeżeli wektory \mathbf X i \mathbf Y są nie tylko wzajemnie niezależne, ale także poszczególne składowe każdego z nich są statystycznie niezależne, metrykę probabilistyczną wektorów losowych można także zdefiniować jako:

D_{**}^{(p)}(\mathbf{X}, \mathbf{Y}) = \left( {\sum_i{D_{**}(X_i, Y_i)}^p}   \right)^\frac1p,

gdzie D_{**}(X_i, Y_i)\, jest szczególną formą metryki probabilistycznej zmiennych losowych dobraną w zależności od rozkładów poszczególnych składowych X_i\,, Y_i\, wektorów \mathbf {X, Y}\,.

Interpretacja fizyczna[edytuj | edytuj kod]

Metrykę probabilistyczną można traktować jako odległość cząstek w mechanice kwantowej, gdzie każdej cząstce odpowiada zespolona funkcja falowa) \psi(x, y, z)\, zależna od współrzędnych przestrzennych, a prawdopodobieństwo dP tego, że cząstka znajduje się w danym elemencie przestrzeni dV wynosi:

dP = |\psi(x, y, z)|^2  dV\,.

Cząstka w studni potencjału[edytuj | edytuj kod]

Rozważmy cząstkę (X) znajdującą się w jednowymiarowej studni potencjału o szerokości L. Jeżeli funkcja falowa tej cząstki ma postać:

\psi_m(x) = \sqrt{\frac{2}{L}} \sin{\left(\frac{m \pi x}{L} \right)}, \,

to odległość tej cząstki od dowolnego punktu \xi \in (0, L)\, studni wynosi:

D(X, \xi) = \int\limits_{0}^L |x-\xi||\psi_m(x)|^2dx = \frac{\xi^2}{L} - \xi +L\left(\frac{1}{2}-\frac{\sin^2(\frac{m\pi\xi}{L})}{m^2\pi^2}\right).

Z właściwości metryki probabilistycznej wynika, że suma odległości pomiędzy krawędzią studni (ξ = 0 lub ξ= L) a danym punktem i metryki probabilistycznej pomiędzy danym punktem a cząstką jest różna od metryki probabilistycznej pomiędzy krawędzią studni a cząstką. Na przykład dla cząstki kwantowej na poziomie energetycznym m = 2:

d(0,0.2L) + D(X, 0.2L) \approx 0.2L + 0.3171L = 0.517L \neq  D(X, 0) = D(X, L) = 0.5L\,.

Metryka probabilistyczna cząstki kwantowej od krawędzi studni jest przy tym niezależna od energii cząstki i wynosi zawsze 0.5L.

Dwie cząstki w studni potencjału[edytuj | edytuj kod]

Wzajemną odległość dwóch cząstek X, Y znajdujących się w jednowymiarowej studni potencjału o szerokości L, dla których funkcje falowe mają postać:

\psi_m(x) = \sqrt{\frac{2}{L}} \sin{\left(\frac{m \pi x}{L} \right)}, \,
\psi_n(y) = \sqrt{\frac{2}{L}} \sin{\left(\frac{n \pi y}{L} \right)}, \,

można wyrazić za pomocą metryki probabilistycznej zmiennych niezależnych jako:

\begin{align}
&{} D(X, Y) = \int\limits_{0}^L \int\limits_0^L |x-y||\psi_m(x)|^2|\psi_n(y)|^2 \, dx\, dy \\
&{} = \begin{cases} L\left(\frac{4 \pi^2 m^2 -15}{12\pi^2m^2} \right) & m=n, \\ L\left(\frac{2 \pi^2 m^2 n^2 -3m^2 - 3n^2}{6\pi^2m^2n^2} \right) & m \neq n 
\end{cases}\end{align}

Odległość między cząstkami jest najmniejsza dla m = 1 i n = 1, czyli dla minimalnej energii cząstek X i Y i wynosi:

\min(D(X, Y)) = L\left(\frac{4 \pi^2-15}{12\pi^2} \right) \approx 0.2067L. \,

Zgodnie z właściwościami metryki probabilistycznej odległość ta jest niezerowa. Dla wyższych poziomów energii m, n zmierza do L/3.

Linki zewnętrzne[edytuj | edytuj kod]