Radialna funkcja bazowa

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Radialna funkcja bazowa (ang. radial basis function - RBF) – funkcja rzeczywista, której wartość zależy zwykle wyłącznie od odległości od określonego punktu. Funkcje te są używane w funkcjach aproksymacji, dla ciągów prognoz czasowych i sterowania. W sztucznych sieciach neuronowych radialne funkcje bazowe są wykorzystywane jako funkcje aktywacji.

Każda funkcja \rho która spełnia własność \rho(x) = \rho(||x||)\, jest funkcją radialną. Za normę uznaje się zwykle metrykę euklidesową. Odległość może być mierzona od dowolnego punktu xk: \rho(x, x_{k}) = \rho(||x-x_{k}||)\,. Punkt xk, który zwykle jest znanym punktem aproksymacyjnym, nazywamy centrum.

Dwie nieznormalizowane radialne funkcje bazowe, z jednowymiarowym wejściem. Centra są zlokalizowane: x1 = 0.75; x2=3.25.

Metody aproksymacyjne[edytuj | edytuj kod]

Wagowa kombinacja radialnych funkcji bazowych

y(\mathbf{x}) = \sum_{k=1}^K w_k \rho(||\mathbf{x} - \mathbf{x}_k||)

może być użyta do aproksymacji dowolnych funkcji ciągłych z bezwzględną dokładnością dla punktów gęsto położonych. Taka suma może być rozumiana jako typ sztucznych sieci neuronowych, zwanych sieciami radialnych funkcji bazowych. Aproksymacja jest zmienna, co pozwala na "uczenie" współczynników wagowych wk stanowiących rozwiązanie układu K (liczba wszystkich punktów aproksymacyjnych) równań spełniających warunek:

y_k = \sum_{l=1}^K w_l \rho_{lk},

gdzie y(\mathbf{x}_k) = y_k\, oznacza znane wartości aproksymacyjne w znanych punktach aproksymacyjnych xk, \rho_{lk} = \rho(||\mathbf{x}_l - \mathbf{x}_k||)\,, a l = 1,2,..,K\,.

Macierz powyższego układu ma postać:


\begin{bmatrix}
y_1 \\
... \\
y_K \end{bmatrix}
=
\begin{bmatrix}
\rho_{11} & ... & ... \\
... & ... & ... \\
... & ... & \rho_{KK} \end{bmatrix}
\begin{bmatrix}
w_1 \\
... \\
w_K \end{bmatrix}

i jest symetryczna (co wynika z własności funkcji bazowych i drugiego aksjomatu metryki), a poprzez odpowiedni dobór funkcji bazowych, również dodatnio-określona[1]. Metoda funkcji radialnych jest nowoczesną metodą aproksymacyjną. Jej wadą jest jednak konieczność wyznaczenia wektora K współczynników aproksymacyjnych wk, co dla dużych zbiorów danych może być bardzo czasochłonne.

Przykłady radialnych funkcji bazowych[edytuj | edytuj kod]

Zwykle stosuje się następujące typy radialnych funkcji bazowych:

  1. liniową: \rho(r) = r\,,
  2. sześcienną: \rho(r) = r^3\,,
  3. cienkiej płytki: (ang. thin-plate spline)[2]: \rho(r) = r^2 \log(r)\,,
  4. gaussowską: (ang. gaussian): \rho(r) = \exp(-\beta r^2)\,,
  5. wielokwadratową (ang. multiquadratic): \rho(r) = \sqrt{r^2 + \beta^2},
  6. odwrotną wielokwadratową (ang. inverse multiquadratic): \rho(r) = \left(r^2 + \beta^2\right)^{-1/2},
  7. wielomianową (ang. polynomial): \rho(r) = r^2 + \beta^2\,,
  8. funkcję Wendlanda[3]: \rho(r) = \begin{cases}\left(1-\frac{r}{R}\right)^4\left(4\frac{r}{R}+1\right) & \frac{r}{R} < 1 \\ 0 & \frac{r}{R} \geqslant 1 \end{cases},
  9. funkcję Wu[4]: \rho(r) = \begin{cases}\left(1-\frac{r}{R}\right)^4\left(4+16\frac{r}{R}+12\left(\frac{r}{R}\right)^2+3\left(\frac{r}{R}\right)^3\right) & \frac{r}{R} < 1 \\ 0 & \frac{r}{R} \geqslant 1 \end{cases}.

Cechą wspólną funkcji bazowych 4-7 jest zastosowanie parametru rozmycia β > 0, pozwalającego na uniknięcie osobliwości lub złego uwarunkowania macierzy układu[5] wynikających między innymi z zerowania się odległości (r) dla nakładających się lub bliskich sobie punktów aproksymacyjnych xk. Właściwy dobór parametru β może być jednak problematyczny i zwykle stosuje się tu jakieś dodatkowe kryterium, zależne od właściwości fizycznych analizowanego problemu. Jedną ze znanych propozycji jest kryterium związane z błędem pomiaru odległości[6] punktów aproksymacyjnych. Inną możliwością jest zastosowanie metryki pomiarowej.

Inną możliwością jest określenie minimalnej dopuszczalnej odległości pomiędzy punktami aproksymacyjnymi (ang. data separation), bądź też zastosowanie funkcji bazowych o zwartym podłożu (ang. compact support) 8 lub 9 jakim jest obszar wokół punktu 0 i promieniu R, jaki w tym przypadku stanowi parametr kontrolny.

Dodatkowo, dzięki zastosowaniu funkcji o zwartym podłożu typu macierz układu równań, z rozwiązania, którego określane są współczynniki wk jest nie tylko symetryczna i dodatnio-określona, ale również rzadka, co pozwala na zastosowanie szybkich algorytmów iteracyjnych. Ponadto reprezentacja funkcji aproksymacyjnej ma wtedy charakter lokalny, przez co złożoność obliczeniowa samego procesu aproksymacji jest znacznie mniejsza[5].

Przypisy

  1. Buhmann M. D., Multivariate interpolation using radial basis functions, Ph. D. Thesis, University of Cambridge, England, 1989.
  2. Duchon J., Splines minimizing rotation-invariant semi-norms in Sobolev spaces, Multivariate Approximation Theory, Birkhauser, 1977.
  3. Wendland H., Piecewise polynomial, positive definite and compactly supported radial functions of minimal degree, Advances in Comp. Mathematics, 4, 1995.
  4. Wu Z., Multivariate compactly supported positive definite radial functions, Advances in Computational Mathematics, 4(3), 1996.
  5. 5,0 5,1 Hjelle Ø., Explicit Surfaces in Siscat, The Siscat Report Series SINTEF, Oslo, March 1996.
  6. Karmowski W., Wspomagana teorią interpretacja wyników eksperymentów mechaniki ciał odkształcalnych, Politechnika Krakowska, monografia 251, Kraków, 1999.