Pochodna Gâteaux

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Pochodna Gâteaux lub różniczka Gâteaux, czyt. ~ ˈɡa.tɔ ( odsłuchaj) – w matematyce uogólnienie pojęcia pochodnej kierunkowej znanego z rachunku różniczkowego. Nazwa pochodzi od nazwiska francuskiego matematyka, René Gâteaux. Pochodną tą definiuje się w przestrzeniach liniowo-topologicznych lokalnie wypukłych takich jak przestrzenie Banacha. Podobnie jak pochodna Frécheta, pochodna Gâteaux służy często sformalizowaniu pochodnej funkcjonalnej używanej powszechnie w rachunku wariacyjnym i fizyce.

W przeciwieństwie do innych rodzajów pochodnych, różniczka Gâteaux funkcji może być nieliniowa. Często w definicji różniczki Gâteaux wymaga się jednak, by była przekształceniem liniowym ciągłym. Niektórzy autorzy, np. Tikhomirov[1], odróżniają różniczkę Gâteaux (która może być nieliniowa) od pochodnej Gâteaux (o której zakładają, iż jest liniowa). W większości zastosowań ciągłość liniowa wynika z pierwotniejszego, a przy tym naturalnego w danej sytuacji warunku, np. założenie różniczkowalności zespolonej w kontekście nieskończeniewymiarowej holomorficzności, czy różniczkowalności w sposób ciągły w analizie nieliniowej.

Definicja[edytuj | edytuj kod]

Niech X oraz Y będą przestrzeniami liniowo-topologicznymi lokalnie wypukłymi (np. przestrzeniami Banacha), dany zbiór otwarty U \subseteq X oraz funkcja F\colon X \to Y. Różniczkę Gâteaux \operatorname{d}F(u; \psi) funkcji F w punkcie u \in U i kierunku \psi \in X definiuje się jako

\operatorname dF(u; \psi) = \lim_{\tau \to 0} \frac{F(u + \tau\psi) - F(u)}{\tau} = \left.\frac{\operatorname d}{\operatorname d\tau} F(u + \tau\psi) \right|_{\tau = 0},

o ile granica ta istnieje. Jeżeli istnieje ona dla wszystkich \psi \in X, to mówi się, że F jest różniczkowalna w sensie Gâteaux w punkcie u.

Granicę w definicji wzięto w sensie topologii Y. Jeżeli X i Yrzeczywistymi przestrzeniami liniowo-topologicznymi, to \tau w granicy są wartościami rzeczywistymi. Z drugiej strony, jeżeli przestrzenie te są zespolone, to w powyższej granicy przyjmuje się \tau \to 0 na płaszczyźnie zespolonej, jak ma to miejsce w definicji różniczki zespolonej. W pewnych przypadkach zamiast mocnej granicy bierze się w zamian słabą granicę, co prowadzi do pojęcia słabej pochodnej Gâteaux.

Liniowość i ciągłość[edytuj | edytuj kod]

W każdym punkcie u \in U różniczka Gâteaux definiuje funkcję

\operatorname dF(u; \cdot)\colon X \to Y.

Jest ona jednorodna w tym sensie, iż dla wszystkich skalarów \alpha zachodzi równość

\operatorname dF(u; \alpha\psi) = \alpha \operatorname dF(u; \psi).

Funkcja ta nie musi być jednak addytywna, tak więc w przeciwieństwie do różniczki Frécheta różniczka Gâteaux może nie być liniowa. Nawet jeżeli będzie ona liniowa, to może nie zależeć w sposób ciągły od \psi, co może mieć miejsce, gdy X oraz Y są nieskończeniewymiarowe. Co więcej, istnieje kilka nierównoważnych sposobów określenia różniczkowalności w sposób ciągły tych różniczek Gâteaux, które liniowe i ciągłe w \psi.

Niech dana będzie na przykład funkcja F dwóch zmiennych rzeczywistych o wartościach rzeczywistych określona wzorem

F(x, y)= \begin{cases}\frac{x^3}{x^2 + y^2}, & \mbox{gdy } (x, y) \ne (0, 0); \\ 0, & \mbox{gdy } (x, y) = (0, 0).\end{cases}

Jest ona różniczkowalna w sensie Gâteaux w punkcie (0, 0), przy czym jej różniczką w tym punkcie jest

\operatorname dF(0, 0; a, b) = \begin{cases}\frac{a^3}{a^2 + b^2} & \mbox{dla } (a, b) \ne (0, 0); \\ 0 & \mbox{dla } (a, b) = (0, 0).\end{cases}

Wprawdzie jest ona ciągła, ale nie jest liniowa ze względu na argumenty (a, b). W przypadku nieskończeniewymiarowym dowolny funkcjonał liniowy nieciągły jest różniczkowalny w sensie Gâteaux; choć jego różniczka Gâteaux w 0 jest liniowa, to jednak nie jest ciągła.

Związek z pochodną Frécheta

Jeżeli F jest różniczkowalna w sensie Frécheta, to jest różniczkowalna także w sensie Gâteaux, przy czym pochodne te są równe. Sytuacja odwrotna w ogólności nie zachodzi, ponieważ pochodna Gâteaux może nie być liniowa lub ciągła. W rzeczywistości jest nawet możliwe, by pochodna Gâteaux była tak liniowa jak i ciągła, ale pochodna Frécheta nie istniała.

Jednakże dla funkcji F z zespolonej przestrzeni Banacha X w inną zespoloną przestrzeń Banacha Y pochodna Gâteaux (gdzie granica brana jest przy zespolonym parametrze \tau zbiegającym do zera jak to jest w definicji różniczkowalności zespolonej) jest koniecznie liniowa, o czym mówi twierdzenie Zorna[2]. Więcej, jeżeli F jest różniczkowalna w (zespolonym) sensie Gâteaux w każdym punkcie u \in U, gdzie pochodna dana jest wzorem

\operatorname DF(u) \colon \psi \mapsto \operatorname dF(u; \psi),

to F jest różniczkowalna w sensie Frécheta na U, a jej różniczką Frécheta jest \operatorname DF[3]. Jest to odpowiednik wyniku elementarnej analizy zespolonej, mianowicie: funkcja jest analityczna, jeżeli jest różniczkowalna w sensie zespolonym na zbiorze otwartym; przy czym jest to podstawowym wynik holomorficzności nieskończeniewymiarowej.

Różniczkowalność w sposób ciągły

Różniczkowalność w sensie Gâteaux w sposób ciągły może być określona na dwa nierównoważne sposoby. Niech F\colon U \to Y będzie różniczkowalna w sensie Gâteaux w każdym punkcie zbioru otwartego U. Jedno z podejść do różniczkowalności w sposób ciągły na U wymaga, aby odwzorowanie z przestrzeni produktowej

\operatorname dF\colon U\times X \to Y

było ciągłe. Założenie liniowości jest zbędne: jeżeli X oraz Yprzestrzeniami Frécheta, to \operatorname dF(u; \cdot) jest automatycznie ograniczone i liniowe dla wszystkich u[4].

W mocniejszym z pojęć różniczkowalności w sposób ciągły wymaga się, aby

u \mapsto \operatorname DF(u)

było odwzorowaniem ciągłym

U \to \operatorname L(X, Y)

z U w przestrzeń ciągłych funkcji liniowych z X w Y. Należy zauważyć, że czyni to zadość liniowości \operatorname DF(u).

Ze względu na to, że drugie pojęcie jest dogodniejsze technicznie, to właśnie je zwykle (lecz nie zawsze) stosuje się w przypadku, gdy przestrzenie X i Y są Banacha, ponieważ wtedy \operatorname L(X, Y) również jest Banacha, co umożliwia posiłkowanie się metodami analizy funkcjonalnej. Pierwszą z definicji spotyka się częściej w tych obszarach analizy nieliniowej, w których rozpatrywane przestrzenie funkcyjne niekoniecznie są Banacha. Na przykład różniczkowanie w przestrzeniach Frécheta ma zastosowania takie jak twierdzenie Nasha-Mosera o funkcji odwrotnej, w którym rozważane przestrzenie funkcyjne często składają się z funkcji gładkich określonych na rozmaitości.

Pochodne wyższych rzędów[edytuj | edytuj kod]

Pochodne Frécheta wyższych rzędów definiuje się w sposób naturalny jako funkcje wieloliniowe ze względu na iterację przy pomocy izomorfizmów \operatorname L^n(X, Y) = \operatorname L(X, \operatorname L^{n-1}(X, Y)). Pochodnych Gâteaux wyższych rzędów nie można jednak definiować w ten sposób, w zamian pochodną Gâteaux n-tego rzędu funkcji F\colon U \subseteq X \to Y w kierunku h definiuje się jako

\operatorname d^n F(u; h) = \left.\frac{\operatorname d^n}{\operatorname d\tau^n}F(u + \tau h)\right|_{\tau = 0}.

Choć funkcja ta nie jest ona wieloliniowa, to jest ona jednorodna stopnia n w punkcie h.

Innym kandydatem na definicję pochodnej wyższego rzędu jest funkcja

\operatorname D^2F(u)\{h, k\} = \lim_{\tau \to 0} \frac{\operatorname DF(u + \tau k)h - \operatorname DF(u)h}{\tau} = \left.\frac{\partial^2}{\partial\tau \partial\sigma} F(u + \sigma h + \tau k)\right|_{\tau = \sigma = 0},

która pojawia się w naturalny sposób w rachunku wariacyjnym jako druga wariacja funkcji F, przynajmniej w przypadku szczególnym, gdy F ma wartości skalarne. Może ona jednak nie mieć żadnych rozsądnych własności poza jednorodnością oddzielnie ze względu na każdy z parametrów h oraz k. Dogodne są wtedy dodatkowe warunki dostateczne zapewniające o tym, że \operatorname D^2F(u)\{h, k\} jest symetryczną funkcją dwuliniową zmiennych h i k oraz że zgadza się ona z polaryzacją \operatorname d^n F.

Na przykład spełniony jest następujący warunek dostateczny[4]. Niech F będzie klasy C^1 w sensie, iż odwzorowanie

\operatorname DF\colon U \times X \to Y

jest ciągłe względem topologii produktowej i, co więcej, że druga pochodna określona powyższym wzorem jest również ciągła w tym sensie, iż odwzorowanie

\operatorname D^2F\colon U \times X \times X \to Y

jest ciągłe. Wówczas przekształcenie \operatorname D^2 F(u)\{h, k\} jest dwuliniowe i symetryczne ze względu na h i k. Tożsamość polaryzacyjna jest spełniona na mocy dwuliniowości:

\operatorname D^2 F(u)\{h, k\} = \tfrac{1}{2}\operatorname d^2 F(u; h + k) - \operatorname d^2 F(u; h) - \operatorname d^2 F(u; k)

wiążąc pochodną drugiego rzędu \operatorname D^2 F(u) z różniczką \operatorname d^2 F(u, \cdot). Podobne wnioski są prawdziwe dla pochodnych wyższych rzędów.

Własności[edytuj | edytuj kod]

Dla funkcji F, o której przyjmie się, iż jest dostatecznie różniczkowalna w sposób ciągły, zachodzi pewna wersja podstawowego twierdzenia rachunku całkowego; dokładniej:

Twierdzenie podstawowe

Niech F\colon X \to Y będzie klasy C^1 w tym sensie, iż pochodna Gâteaux jest funkcją ciągłą \operatorname dF\colon U \times X \to Y. Wówczas dla dowolnych u \in U oraz h \in X jest

F(u + h) - F(u) = \int_0^1 \operatorname dF(u + th; h)\,\operatorname dt,

gdzie symbol całki oznacza całkę Gelfanda-Pettisa (słabą całkę).

Z powyższego wynika także wiele znanych, porządnych własności pochodnej – w tym wieloliniowość i przemienność pochodnych wyższego stopnia. Innymi własnościami, również wynikającymi z twierdzenia podstawowego, są:

Reguła łańcuchowa
\operatorname d(G \circ F)(u; x) = \operatorname dG(F(u); \operatorname dF(u; x))

dla dowolnych u \in U oraz x \in X.

Twierdzenie Taylora z resztą

Niech odcinek między u \in U a u + h zawiera się całkowicie w U. Wówczas jeżeli F jest klasy C^k, to

F(u + h) = F(u) + \operatorname dF(u; h) + \frac{1}{2!}\operatorname d^2F(u; h) + \dots + \frac{1}{(k-1)!}\operatorname d^{k-1}F(u;h) + R_k,

gdzie wyraz reszty dany jest jako

R_k(u; h) = \frac{1}{(k-1)!}\int_0^1(1-t)^{k-1}\operatorname d^k F(u + th; h)\,\operatorname dt.

Przykłady[edytuj | edytuj kod]

Niech X będzie przestrzenią Hilberta funkcji całkowalnych z kwadratem określonych na zbiorze mierzalnym w sensie Lebesgue'a \Omega przestrzeni euklidesowej \mathbb R^n. Funkcjonał

E\colon X \to \mathbb R

dany wzorem

E(u) = \int_\Omega F\left(u(x) \right)\operatorname dx,

gdzie F jest funkcją zmiennej rzeczywistej o wartościach rzeczywistych, przy czym F' = f, a u przyjmująca wartości rzeczywiste jest określona na \Omega, ma pochodną Gâteaux

\operatorname dE(u, \psi) = \langle f(u), \psi \rangle.

Rzeczywiście,

\begin{align}\frac{E(u + \tau\psi) - E(u)}{\tau} & = \frac{1}{\tau} \left( \int_\Omega F(u + \tau\psi)\operatorname dx - \int_\Omega F(u)\operatorname dx \right) = \\ & = \frac{1}{\tau} \left( \int_\Omega\int_0^1 \frac{\operatorname d}{\operatorname ds} F(u + s\tau\psi) \,\operatorname ds\,\operatorname dx \right) = \\ & = \int_\Omega\int_0^1 f(u + s\tau\psi)\psi \,\operatorname ds\,\operatorname dx.\end{align}

Jeżeli \tau \to 0 w powyższej równości, to pochodna Gâteaux

\operatorname dE(u, \psi) = \int_\Omega f(u(x))\psi(x) \,\operatorname dx,

jest iloczynem wewnętrznym \langle f, \psi\rangle.

Zobacz też[edytuj | edytuj kod]

Przypisy

  1. V.M. Tikhomirov. Gâteaux variation. „Encyclopaedia of Mathematics”, 2001. Hazewinkel, Michiel: Kluwer Academic Publishers. 
  2. Max Zorn. Characterization of analytic functions in Banach spaces. „Annals of Mathematics. Second Series”. 46, s. 585–593, 1945. ISSN 0003-486X. MSN 0014190. 
  3. Max Zorn. Derivatives and Frechet differentials. „Bulletin of the American Mathematical Society”. 52 (2). s. 133–137. doi:10.1090/S0002-9904-1946-08524-9. MR 0014595. 
  4. 4,0 4,1 Hamilton, R. S.. The inverse function theorem of Nash and Moser. „Bull. AMS.”. 7 (1), s. 65–222, 1982. doi:10.1090/S0273-0979-1982-15004-2. MR 656198. 

Bibliografia[edytuj | edytuj kod]