Przestrzeń unitarna

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania
Ujednoznacznienie Ten artykuł dotyczy uogólnienia iloczynu skalarnego na abstrakcyjnie przestrzenie liniowe. Zobacz też: standardowy iloczyn skalarny w przestrzeniach euklidesowych.

Przestrzeń unitarna (prehilbertowska) – w matematyce, przestrzeń liniowa wyposażona dodatkowo w iloczyn skalarny będący uogólnieniem standardowego iloczynu skalarnego. Przestrzenie unitarne można traktować jako naturalne odpowiedniki przestrzeni euklidesowych, w których możliwe jest zdefiniowanie (bądź uogólnienie) takich pojęć jak kąt, długość wektora (dokładniej norma elementu przestrzeni unitarnej) czy wreszcie ortogonalności elementów. Przestrzenie unitarne, zupełne ze względu na metrykę generowaną przez normę (zależną od iloczynu skalarnego), nazywane są przestrzeniami Hilberta i studiowane są w analizie funkcjonalnej. W związku z tym przestrzenie unitarne nazywane są czasem prehilbertowskimi.

Formy hermitowskie[edytuj | edytuj kod]

Wiele zagadnień matematycznych sprowadza się do rozważania operatorów liniowych zespolonych przestrzeni liniowych (problem ten, jak się później okaże, nie istnieje dla przestrzeni rzeczywistych). Często, pojawia się potrzeba wprowadzenia pojęcia iloczynu skalarnego również dla elementów takich przestrzeni. Niewystarczające są jednak w tym przypadku iloczyny skalarne zdefiniowane jako formy dwuliniowe B(\mathbf x, \mathbf y), gdyż odpowiadające im formy kwadratowe \|\mathbf x\|^2 = B(\mathbf x, \mathbf x) miałyby własność

\|i\mathbf x\|^2 = B(i\mathbf x, i\mathbf x) = i^2 B(\mathbf x, \mathbf x) = -\|\mathbf x\|^2,

co jest sprzeczne z intuicją dotyczącą długości wektora (długość powinna być nieujemna). Stąd zrodziła się potrzeba dokładniejszego zdefiniowania tego, co będzie później nazwane iloczynem skalarnym. Lekarstwem na zaistniałą sytuację było wprowadzenie funkcjonału półtoraliniowego \varphi, który byłby liniowy ze względu na jedną ze współrzędnych, lecz antyliniowy ze względu na drugą, tzn. przykładowo:

\varphi(\cdot, \mathbf y) jest liniowe dla dowolnego \mathbf y \in V,
\varphi(\mathbf x, \cdot) jest antyliniowe dla dowolnego \mathbf x \in V.

Formę półtoraliniową h nazywa się hermitowską, jeśli dla dowolnych \mathbf x, \mathbf y \in V spełnia ona równość

h(\mathbf y, \mathbf x) = \overline{h(\mathbf x, \mathbf y)}.

Definicja[edytuj | edytuj kod]

Przestrzeń liniową V nad ciałem \mathbb K\in \{ \mathbb R, \mathbb C\} z ustalonym funkcjonałem f\colon V^2 \to \mathbb K nazywa się przestrzenią unitarną jeśli spełnione s następujące postulaty:

dla dowolnych \mathbf x, \mathbf y, \mathbf z \in V,\; a, b \in \mathbb K.
  • niezdegenerowanie,
jeśli \langle \mathbf x,\mathbf x \rangle = 0, to \mathbf x =  0,
  • dodatnia określoność
\langle \mathbf x, \mathbf x \rangle \geqslant 0.

Wielkość \langle \mathbf x, \mathbf y \rangle = f(\mathbf x, \mathbf y) nazywa się iloczynem skalarnym lub iloczynem wewnętrznym wektorów \mathbf x i \mathbf y.

Uwagi[edytuj | edytuj kod]

Dla przestrzeni rzeczywistej hermitowskość przechodzi w zwykłą symetrię iloczynu skalarnego, co tłumaczy się faktem, iż sprzężenie zespolone liczby rzeczywistej jest równe jej samej. Wówczas też iloczyn skalarny okazuje się być dwuliniowy. Można więc przyjąć wspólną definicję (dla przestrzeni zespolonych), jednak w przypadku przestrzeni rzeczywistych wygodniej mówić jest często o dodatnio określonych funkcjonałach dwuliniowych.

Istnieje wiele powodów technicznych dla których niezbędnym jest ograniczenie rozważanego ciała do \mathbb R oraz \mathbb C. Co najważniejsze, ciało musi zawierać uporządkowane podciało (aby warunek nieujemności miał sens), a zatem musi mieć charakterystykę równą zeru. Wyklucza to natychmiast ciała skończone, które poza tym muszą mieć dodatkową strukturę, np. wyróżniony automorfizm.

Rozważa się także przestrzenie liniowe z funkcjonałami spełniającymi powyższe postulaty z pominięciem postulatu dodatniej określoności. Więcej na ten temat znaleźć można w dalszej części artykułu.

Odwzorowanie z V w przestrzeń dualną V^* dane wzorem {\mathbf x} \mapsto \langle {\mathbf x}, \cdot \rangle jest izomorfizmem. Bezpośrednio z liniowości ze względu na pierwszą zmienną wynika, że jest to homomorfizm przestrzeni liniowych. Łatwo sprawdza się, że odwzorowanie to jest również iniektywne:

\langle \mathbf x, \mathbf y \rangle = 0 dla każdego \mathbf y \in V wtedy i tylko wtedy, gdy \mathbf x = 0.

W skończeniewymiarowych przestrzeniach liniowych warunek ten jest wystarczający do stwierdzenia, iż jest to izomorfizm.

Konwencje[edytuj | edytuj kod]

Jak już wspomniano iloczyn skalarny jest półtoraliniowy, tzn. liniowy ze względu na jeden i antyliniowy ze względu na drugi argument. Wybór który z argumentów jest liniowy, a który antyliniowy jest całkowicie dowolny i stosuje się obie możliwości. Matematycy zwykle przyjmują antyliniowość ze względu na drugi argument, natomiast fizycy ze względu na pierwszy, co ułatwia im stosowanie notacji Diraca używanej w mechanice kwantowej (umożliwia wyciąganie skalarów z ketów, co reprezentuje wektory, a sprzężenie skalarów przy wyciąganiu z bra reprezentuje funkcjonały liniowe) i używane jest teraz okazjonalnie także przez matematyków. Niektórzy autorzy stosują konwencję, że \langle \cdot, \cdot \rangle oznacza liniowość ze względu na pierwszy argument, zaś \langle \cdot | \cdot \rangle na drugi, choć nie jest to regułą; przykładowo (Emch [1972]) się do niej nie stosuje.

Istnieją również inne sposoby zapisu:

(\mathbf x, \mathbf y)
(\mathbf x | \mathbf y),

lub po prostu

\mathbf x \cdot \mathbf y,

która jest oznaczeniem standardowego iloczynu skalarnego przestrzeni euklidesowych.

Przestrzeń współrzędnych zespolonych[edytuj | edytuj kod]

W n-wymiarowej przestrzeni współrzędnych zespolonych następująco wprowadza się strukturę przestrzeni unitarnej.

Iloczyn skalarny dany jest wzorem

\mathbf{x} \cdot \mathbf{y} = \sum_{i=1}^n x_i \overline{y_i} = x_1 \overline{y_1} + x_2 \overline{y_2} + \dots + x_n \overline{y_n},

gdzie \overline{\mathrm{y}} oznacza sprzężenie zespolone liczby \mathrm{y}.

Norma wyznaczona przez ten iloczyn zdefiniowana jest naturalnie jako

\|\mathbf v\| = \sqrt{\mathbf{v} \cdot \mathbf{v}}.

Wzór na metrykę tej przestrzeni również nie ulega zmianie:

d_{e}(\mathrm{x}, \mathrm{y}) = \|\mathrm{x} - \mathrm{y}\| = \sqrt{\sum_{i=1}^n (x_i - y_i)^2}.

Ze względu na algebraiczną domkniętość ciała \mathbb{C} pewne aspekty teorii takich przestrzeni okazują się prostsze i bardziej spójne niż dla przestrzeni euklidesowych.

Norma a iloczyn skalarny[edytuj | edytuj kod]

Iloczyn skalarny pozwala określić normę wektora, czyli jego długość:

\|\mathbf x\| = \sqrt{\mathbf x \cdot \mathbf x}.

Ważną własnością tak otrzymanej normy jest tożsamość równoległoboku:

2\|\mathbf x\|^2 + 2\|\mathbf y\|^2 = \|\mathbf x + \mathbf y\|^2 + \|\mathbf x - \mathbf y\|^2.

W każdej przestrzeni unormowanej, w której norma spełnia tożsamość równoległoboku można wprowadzić iloczyn skalarny wzorem:  \mathbf x \cdot \mathbf y = \frac 1 2 (\|\mathbf x + \mathbf y\|^2 - \|\mathbf x\|^2 - \|\mathbf y\|^2). Wzór ten jest dobry tylko dla przestrzeni rzeczywistych.

Przykłady[edytuj | edytuj kod]

Przestrzeń liczb rzeczywistych ze standardowym iloczynem skalarnym zdefiniowanym jako

\langle \mathbf x, \mathbf y \rangle := \mathbf{xy}

jest trywialną przestrzenią unitarną.

Ogólniej w przestrzeni euklidesowej \mathbb R^n dla \mathbf a = (a_1, \dots, a_n) oraz \mathbf b = (b_1, \dots, b_n) standardowy iloczyn skalarny określony jest wzorem

\mathbf a \cdot \mathbf b = a_1 b_1 + \dots + a_n b_n.

Przestrzeń funkcji rzeczywistych zmiennej rzeczywistej, całkowalnych z kwadratem na pewnym przedziale I z iloczynem skalarnym

\langle f, g \rangle := \int\limits_I f(x)g(x)dx

jest unitarna.

Własności[edytuj | edytuj kod]

Nierówność Schwarza[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: nierówność Schwarza.
|\langle \mathbf x, \mathbf y \rangle|^2 \leqslant \langle \mathbf x, \mathbf x \rangle \langle \mathbf y, \mathbf y \rangle,

przy czym równość zachodzi wtedy i tylko wtedy, gdy \mathbf x i \mathbf yliniowo zależne.

Norma i metryka[edytuj | edytuj kod]

Ze względu na własności iloczynu skalarnego, funkcja \|\cdot\| taka, że

\|\mathbf x\| := \sqrt{\langle \mathbf x, \mathbf x \rangle}

spełnia aksjomaty normy. Normę tę nazywamy normą generowaną przez iloczyn skalarny. Z tego też względu każda przestrzeń unitarna jest także unormowana. Ponadto funkcja d(\mathbf x, \mathbf y) = \|\mathbf x - \mathbf y\| jest metryką.

Korzystając z powyższej definicji normy możemy zdefiniować kąt między wektorami \mathbf x oraz \mathbf y jako:

\measuredangle(\mathbf x, \mathbf y) := \begin{cases} \arccos\left(\tfrac{\langle \mathbf x, \mathbf y \rangle}{\|\mathbf x\|\cdot\|\mathbf y\|}\right), & \mbox{dla } \mathbf x \ne \mathbf 0 \and \mathbf y \ne \mathbf 0 \\ 0, & \mbox{dla } \mathbf x = \mathbf 0\ \or \mathbf y = \mathbf 0 \end{cases}.

Ortogonalność[edytuj | edytuj kod]

Wektory x i y nazywamy ortogonalnymi wtedy i tylko wtedy, gdy \langle \mathbf x, \mathbf y \rangle = 0 i oznaczamy x \perp y.

Ortogonalność jest uogólnieniem geometrycznego pojęcia prostopadłości w przestrzeniach kartezjańskich. Oczywistym jest, że cosinus kąta zawartego między dwoma wektorami ortogonalnymi jest równy zero.

Jeżeli układ wektorów \mathbf u_1, \dots, \mathbf u_k \in V spełnia warunek \langle \mathbf u_i, \mathbf u_j \rangle = 0 dla i, j = 1, \dots, k\; i \ne j, to nazywamy go układem ortogonalnym. Każdy układ ortogonalny jest liniowo niezależny.

Ponadto jeżeli układ taki jest bazą przestrzeni V, wtedy mówimy o bazie ortogonalnej. Z każdej bazy przestrzeni unitarnej można otrzymać bazę ortogonalną. Proces taki nazywa się ortogonalizacją. Najczęściej stosowana w praktyce jest ortogonalizacja Grama-Schmidta.

Zdegenerowane iloczyny skalarne[edytuj | edytuj kod]

Jeżeli V jest przestrzenią liniową, a \langle \cdot, \cdot \rangle półokreślonym funkcjonałem półtoraliniowym, to funkcja \|\mathbf x\|\ = \langle \mathbf x, \mathbf x \rangle^\tfrac{1}{2} spełnia wszystkie własności normy poza warunkiem \|\mathbf x\|\ = 0 \implies \mathbf x = \mathbf 0 (takie funkcjonały nazywane są wówczas półnormami). Przestrzeń unitarna może być określona przez rozważenie ilorazu W = V/\{\mathbf x\colon \|\mathbf x\| = 0\}. Funkcjonał półtoraliniowy \langle \cdot, \cdot \rangle faktoryzuje się przez W.

Ta konstrukcja znalazła zastosowanie w wielu miejscach. Konstrukcja Gelfanda-Najmarka-Segala jest szczególnie ważnym przykładem tej techniki, inną jest reprezentacja półokreślonych jąder na dowolnych zbiorach.

Bibliografia[edytuj | edytuj kod]

  • S. Axler, Linear Algebra Done Right, Springer, 2004
  • G. Emch, Algebraic Methods in Statistical Mechanics and Quantum Field Theory, Wiley Interscience, 1972.
  • N. Young, An Introduction to Hilbert Spaces, Cambridge University Press, 1988

Zobacz też[edytuj | edytuj kod]