Przestrzeń współrzędnych

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Przestrzeń współrzędnych – w algebrze liniowej prototypowy model przestrzeni liniowej skończonego wymiaru nad ustalonym ciałem; definiuje się ją jako przestrzeń produktową danego ciała nad skończonym zbiorem indeksów, w szczególności każde ciało można postrzegać jako jednowymiarową przestrzeń współrzędnych z działaniem mnożenia z ciała jako mnożenia przez skalar.

Definicja[edytuj | edytuj kod]

Niech \scriptstyle K będzie ustalonym ciałem (takim jak liczby rzeczywiste \scriptstyle \mathbb R,, liczby zespolone \scriptstyle \mathbb C). Zbiór ciągów \scriptstyle n elementów z ciała \scriptstyle K tworzy nad nim \scriptstyle n-wymiarową przestrzeń liniową \scriptstyle K^n nazywaną przestrzenią współrzędnych z działaniami opisanymi poniżej.

Każdy wektor \scriptstyle \mathbf x ma postać

\mathbf x = (x_1, x_2, \dots, x_n),

przy czym elementy \scriptstyle x_i ciągu nazywa się jego składowymi. Działania przestrzeni liniowej na \scriptstyle K^n zdefiniowane są „po składowych”, czyli wzorami

\mathbf{x + y} = (x_1 + y_1, x_2 + y_2, \dots, x_n + y_n),
c \mathbf x = (cx_1, cx_2, \dots, cx_n).

Wektor zerowy ma postać

\mathbf 0 = (0, 0, \dots, 0),

a wektor przeciwny do \scriptstyle \mathbf x dany jest wzorem

\mathbf{-x} = (-x_1, -x_2, \dots, -x_n).

Wybór bazy[edytuj | edytuj kod]

 Osobny artykuł: baza przestrzeni liniowej.

W przestrzeni współrzędnych wyróżniona jest rodzina ciągów postaci

\mathbf e_i = (0, \dots, 0, 1, 0, \dots, 0),

gdzie \scriptstyle 1 oznaczająca element neutralny mnożenia w \scriptstyle K jest \scriptstyle i-tym elementem ciągu, a pozostałe są równe \scriptstyle 0, czyli elementowi neutralnemu dodawania w \scriptstyle K. Ponieważ każdy wektor \scriptstyle \mathbf x przestrzeni można jednoznacznie wyrazić za pomocą powyższej rodziny,

\mathbf x = \sum_{i = 1}^n x_i \mathbf e_i,

w jednoznaczny sposób, to wspomniane wektory tworzą bazę \scriptstyle K^n – nazywa się ją bazą standardową lub bazę kanoniczną – współrzędne każdego z wektorów w tej bazie pokrywają się z jego składowymi. Nazwa tej przestrzeni wynika z twierdzenia mówiącego, iż każda \scriptstyle n-wymiarowa przestrzeń liniowa \scriptstyle V nad ciałem \scriptstyle K ma strukturę identyczną ze strukturą przestrzeni \scriptstyle K^n. Jednakże metoda utożsamienia tych przestrzeni nie jest uniwersalna – wymaga określenia bazy w przestrzeni \scriptstyle V, a więc wskazania izomorfizmu (liniowego) \scriptstyle V \to K^n. W ten sposób przekształcenie to wprowadza niejako układ współrzędnych tej przestrzeni; dokładniej, jeśli \scriptstyle \mathrm A\colon K^n \to V jest izomorfizmem (różnowartościowym przekształceniem liniowym) danym wzorem

\mathrm A(\mathbf e_i) = \mathbf a_i

dla \scriptstyle i = 1, \dots, n, to wektory \scriptstyle \mathbf a_i tworzą bazę przestrzeni \scriptstyle V. Podobnie dla każdej bazy uporządkowanej złożonej z wektorów \scriptstyle \mathbf a_i można wskazać izomorfizm \scriptstyle \mathrm A\colon K^n \to V dany wzorem

\mathrm A(\mathbf x) = \sum_{i = 1}^n x_i \mathbf a_i.

W ten sposób dowolny wektor \scriptstyle \mathbf v przestrzeni \scriptstyle V można utożsamić z wektorem \scriptstyle \mathbf v_B jego współrzędnych w bazie uporządkowanej \scriptstyle B = (\mathbf b_i) należący do \scriptstyle K^n, mianowicie

\mathbf v = v_1 \mathbf b_1 + v_2 \mathbf b_2 + \dots + v_n \mathbf b_n

odpowiada wtedy wektor złożony z jego współrzędnych w bazie \scriptstyle B,

\mathbf v_B = (v_1, v_2, \dots, v_n).

To jest właśnie powodem, dla którego \scriptstyle K^n nazywa się „przestrzenią współrzędnych” \scriptstyle n-wymiarowej przestrzeni liniowej nad ciałem \scriptstyle K. Mogłoby się wydawać, że abstrakcyjne przestrzenie liniowe (skończonego wymiaru) w świetle dostępności przestrzeni współrzędnych są niepotrzebne, jednak niekiedy dogodniejsze jest operowanie w przestrzeni bez wybranej bazy („układu współrzędnych”); istnieją również przestrzenie liniowe, w których wybór bazy nie jest oczywisty bądź zaciemnia sytuację – nie mniej wszelkie obliczenia i konkretne wymagają wybrania pewnej bazy przestrzeni liniowej (zob. sekcję Uogólnienia).

Macierze[edytuj | edytuj kod]

Składowe wektora \scriptstyle \mathbf x przestrzeni współrzędnych \scriptstyle K^n, tzn. elementy ciągu \scriptstyle (x_1, \dots, x_n) można zapisać w macierzy jednokolumnowej bądź jednowierszowej, tzn. typu \scriptstyle n \times 1 lub \scriptstyle 1 \times n, mianowicie

\begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} \quad \mbox{ lub } \quad \begin{bmatrix} x_1 & x_2 & \dots & x_n \end{bmatrix}.

Działania na tych macierzach definiuje się identycznie jak opisano to w sekcji Definicja, z tego względu zwykle utożsamia się powyższe przestrzenie z przestrzenią współrzędnych[1] bądź definiuje przestrzeń współrzędnych jako przestrzeń macierzy jednego z powyższych typów macierzy nad ciałem \scriptstyle K.

Zwykle przedkłada się macierze jednokolumnowe nad macierze jednowierszowe nazywane odpowiednio wektorami kolumnowymi oraz wektorami wierszowymi, co ma swoje źródło w zastosowaniu macierzy typu \scriptstyle m \times n do opisu we współrzędnych (ustalonych bazach) przekształceń liniowych \scriptstyle K^n \to K^m. Wówczas działaniu przekształcenia liniowego na wektorze i składaniu przekształceń odpowiada mnożenie macierzy w naturalnym porządku, działaniom na przekształceniach \scriptstyle \mathrm A(\mathbf x), \mathrm A \circ \mathrm B odpowiadają działania na macierzach \scriptstyle \mathbf{AX}, \mathbf{AB}, gdzie \scriptstyle \mathbf A, \mathbf B są macierzami przekształceń liniowych \scriptstyle \mathrm A, \mathrm B, a kolejne elementy macierzy jednokolumnowej \scriptstyle \mathbf X pokrywają się z odpowiednimi elementami wektora \scriptstyle \mathbf x.

Na mocy własności przekształcenia liniowego zachodzi

\mathrm A(\mathbf x) = \mathrm A\left(\sum_{i = 1}^n x_i \mathbf e_i\right) = \sum_{i = 1}^n x_i \mathrm A(\mathbf e_i) = \sum_{i = 1}^n x_i \mathbf a_i,

gdzie \scriptstyle \mathbf e_i oznaczają wektory bazy standardowej; wynika stąd, że w celu obliczenia \scriptstyle i-tej składowej obrazu \scriptstyle \mathrm A(\mathbf x) wystarczy znać \scriptstyle \mathbf a_i, czyli obraz \scriptstyle i-tego wektora bazowego \scriptstyle \mathbf e_i w przekształceniu \scriptstyle \mathrm A. W języku macierzy \scriptstyle \mathbf{AE}_i = \mathbf A_i oznacza i-tą kolumnę macierzy \scriptstyle \mathbf A odpowiadającej \scriptstyle \mathrm A. Działanie \scriptstyle \mathbf{AX} można wtedy traktować jako

\mathbf{AX} = \mathbf A\left(\sum_{i = 1}^n x_i \mathbf E_i\right) = \sum_{i = 1}^n x_i \mathbf{AE}_i = \sum_{i = 1}^n x_i \mathbf A_i,

tzn. kombinację liniową składowych wektora kolumnowego \scriptstyle \mathbf X i wektorów kolumnowych \scriptstyle \mathbf A_i (por. mnożenie macierzy metodą współczynniki-wektory), co można zapisać w postaci macierzowej jako

\mathbf{AX} = \begin{bmatrix} x_1 \mathbf A_1 & \dots & x_n \mathbf A_n \end{bmatrix} = \begin{bmatrix} \mathbf A_1 & \dots & \mathbf A_n \end{bmatrix} \mathbf X.

Umożliwia to postrzeganie macierzy \scriptstyle \mathbf A jako ciągu wektorów kolumnowych – odpowiada temu traktowanie przekształcenia liniowego \scriptstyle K^n \to K^m jako przekształcenia wieloliniowego o \scriptstyle n argumentach w przestrzeń \scriptstyle K^m danego wzorem \scriptstyle \mathsf A(x_1, \dots, x_n) \mapsto \mathrm A\displaystyle(\scriptstyle[x_1, \dots, x_n]\displaystyle)\scriptstyle = [x_1 \mathbf a_1, \dots, x_n \mathbf a_n] – obserwacja ta ułatwia niekiedy rozważania teoretyczne[2].

Uogólnienia[edytuj | edytuj kod]

Ponieważ elementami przestrzeni współrzędnych są ciągi, tzn. funkcje określone na zbiorze skończonym \scriptstyle \langle n \rangle = \{1, 2, \dots, n\} o wartościach w \scriptstyle K. W ten sposób wektory są funkcjami, które odwzorowują każdy z elementów \scriptstyle i zbioru \scriptstyle \langle n \rangle na \scriptstyle i-tą składową tego wektora. Dlatego przestrzeń współrzędnych \scriptstyle K^n to w istocie przestrzeń \scriptstyle K^{\langle n \rangle} funkcji \scriptstyle \langle n \rangle \to K. Pomysł ten uogólnia się na przestrzenie funkcji indeksowanych za pomocą dowolnego zbioru \scriptstyle I w postaci tzw. przestrzeni funkcyjnych, w szczególności uogólnionej, czy nieskończonej przestrzeni współrzędnych.

Dualność[edytuj | edytuj kod]

Wybór wektorów kolumnowych typu \scriptstyle n \times 1 nie oznacza, że wektory wierszowe \scriptstyle 1 \times n nie są wtedy używane: z każdą przestrzenią współrzędnych \scriptstyle K^n można związać przestrzeń \scriptstyle \underline{K^n} (oznaczaną zwykle gwiazdką w indeksie górnym za symbolem przestrzeni) form liniowych \scriptstyle K^n \to K nazywanej przestrzenią dualną do \scriptstyle K^n. Każdą formę liniową na \scriptstyle K^n można przedstawić w bazach standardowych (obu przestrzeni) w postaci

u(\mathbf x) = \sum_{i = 1}^n u_i x_i.

Działanie formy \scriptstyle u na wektorze \scriptstyle \mathbf x jest liniowe ze względu tak na wektory, jak i na kowektory z osobna i daje wynik skalarny – można więc na nie patrzeć jako na formę dwuliniową \scriptstyle \underline{K^n} \times K^n \to K daną wzorem

\langle u, \mathbf x \rangle = u(\mathbf x).

Ta niezdegenerowana forma dwuliniowa ustala w ten sposób parowanie doskonałe między kowektorami a wektorami przestrzeni \scriptstyle K^n definiując izomorfizm \scriptstyle \underline{K^n} \to K^n. Dzięki temu utożsamieniu forma \scriptstyle u określona na przestrzeni \scriptstyle K^n (będąca równocześnie wektorem przestrzeni do niej dualnej \scriptstyle \underline{K^n}) znajduje przedstawienie w postaci wektora współrzędnych \scriptstyle \mathbf u; z tego powodu formy liniowe na \scriptstyle K^n nazywa się też kowektorami tej przestrzeni.

Wspomniany izomorfizm (albo ogólniej: parowanie) umożliwia zdefiniowanie transpozycji lub sprzężenia przekształcenia \scriptstyle \mathrm A\colon K^n \to K^m, czyli przekształcenia liniowego \scriptstyle \underline \mathrm A\colon \underline{K^m} \to \underline{K^n} (zwykle oznacza się je gwiazdką lub dużą literą „T” w indeksie górnym po prawej stronie symbolu przekształcenia), które odwzorowuje kowektory przestrzeni \scriptstyle K^m w kowektory na \scriptstyle K^n według wzoru \scriptstyle \underline \mathrm A(u) = u \circ \mathrm A; jego obraz będący formą na \scriptstyle K^n nazywa się cofnięciem[3] \scriptstyle u przez/wzdłuż \scriptstyle \mathrm A. Ze względu na obecność w obu przestrzeniach form dwuliniowych utożsamiających wektory z kowektorami możliwe jest scharakteryzowanie tego odwzorowania za pomocą tożsamości \scriptstyle \langle \underline \mathrm A(u), \mathbf x \rangle = \langle u, \mathrm A(\mathbf x) \rangle, która byłaby spełniona dla wszystkich \scriptstyle u, \mathbf x.

Z definicji mnożenia macierzy wynika[4], że jeśli wektory kolumnowe odpowiadają wektorom danej przestrzeni współrzędnych, to wektory wierszowe reprezentują jej kowektory, gdyż wspomniane parowanie w przypadku macierzy przyjmuje postać

\underline {\mathbf U} \mathbf X = \left[\begin{smallmatrix} u_1 & \dots & u_n \end{smallmatrix}\right]\left[\begin{smallmatrix} x_1 \\ \vdots \\ x_n \end{smallmatrix}\right] = \left[\sum_{i = 1}^n u_i x_i\right] = \bigl[u(\mathbf x)\bigr],

gdzie podkreślenie oznacza izomorfizm \scriptstyle \mathrm{Mat}_{n \times 1} \to \mathrm{Mat}_{1 \times n} odpowiadający utożsamieniu wektorów z kowektorami. Transpozycji przekształcenia liniowego odpowiada transpozycja (nazywana też przestawieniem i oznaczana standardowo dużą literą „T” w indeksie górnym za symbolem) macierzy \scriptstyle \mathbf M typu \scriptstyle m \times n dająca w wyniku macierz \scriptstyle \underline \mathbf M typu \scriptstyle n \times m, która polega na zamianie miejscami jej wierszy i kolumn (z zachowaniem ich porządku).

Choć oczywiste jest, iż \scriptstyle \underline{\underline {\mathbf A}} = \mathbf A, to wcale nie jest jasne, iż \scriptstyle \underline {\underline \mathrm A}\colon \underline{\underline{K^n}} \to \underline{\underline{K^m}}, a w szczególności, iż \scriptstyle \underline{\underline{K^n}} ma tę samą strukturę, co \scriptstyle K^n. Jak można się domyślać, skoro zachodzi równość dla macierzy, to istnieje pewne utożsamienie (izomorfizm) między tymi przestrzeniami – wynika to wprost z faktu, iż dowolne dwie przestrzenie liniowe równego wymiaru skończonego są izomorficzne. W tym wypadku istnieje jednak naturalne przekształcenie danej z przestrzeni z jej drugą dualną (tj. przestrzeni form liniowych określonych na przestrzeni form liniowych danej przestrzeni), które odwzorowywałoby wektor w „ko-kowektor”, czyli formę \scriptstyle \underline{K^n} \to K. Obliczenie wartości (tzw. ewaluacja) formy dla ustalonego wektora, \scriptstyle \mathrm{ev}_\mathbf x\colon u \mapsto u(\mathbf x), jest przekształceniem liniowym ze względu na przyłożone formy, które jest elementem \scriptstyle \underline{\underline{K^n}}. Przekształcenie \scriptstyle \mathrm{ev}\colon \mathbf x \mapsto \mathrm{ev}_\mathbf x, liniowe ze względu na przyłożone wektory, odwzorowuje więc \scriptstyle K^n w przestrzeń \scriptstyle \underline{\underline{K^n}}. W ten sposób działanie \scriptstyle \mathrm{ev} obliczania wartości formy \scriptstyle u przy jej działaniu na wektor \scriptstyle \mathbf x dane wzorem \scriptstyle \mathrm{ev}_\mathbf x(u) = u(\mathbf x) jest naturalnym parowaniem danej przestrzeni i przestrzeni do niej dualnej – przestrzenie, dla których istnieje tego rodzaju utożsamienie (zwykle jest ono tylko zanurzeniem), nazywa się refleksywnymi; są nimi w szczególności przestrzenie współrzędnych, o czym mówi ta uwaga (zob. para dualna).

Analizowanym w poprzedniej sekcji działaniom na przekształceniach, \scriptstyle \mathrm A(\mathbf x), \mathrm A \circ \mathrm B, odpowiada mnożenie następujących macierzy: \scriptstyle \underline \mathbf{XA} oraz \scriptstyle \underline \mathbf{BA}, czyli w odwrotnym porządku – przedkładanie wektorów kolumnowych nad wierszowe przy opisie przekształceń liniowych jest więc czysto arbitralne i wynika z naturalnej w zachodniej kulturze chęci zapisu działań od lewej do prawej[5].

Iloczyn skalarny[edytuj | edytuj kod]

 Osobny artykuł: iloczyn skalarny.

W przestrzeni współrzędnych nad ciałem liczb rzeczywistych \scriptstyle \mathbb R definiuje się działanie odwzorowujące parę wektorów \scriptstyle \mathbf x, \mathbf y w ciało jej skalarów nazywane iloczynem skalarnym tych wektorów:

\mathbf x \cdot \mathbf y := \sum_{i = 1}^n x_i y_i.

Odwzorowanie to wprowadza na przestrzeni \scriptstyle \mathbb R^n strukturę unitarną, w tym pojęcia „długości” i „odległości”; każda przestrzeń liniowa ma naturalną strukturę afiniczną nad samą sobą, dzięki czemu \scriptstyle \mathbb R^n ma strukturę euklidesową.

Z definicji iloczynu skalarnego wynika, że jest przemienny i liniowy ze względu oba argumenty: w oparciu o poprzednią sekcję rozważania te sugerują istnienie niezdegenerowanej formy dwuliniowej \scriptstyle \mathbb R^n \times \mathbb R^n \to \mathbb R będącej parowaniem przestrzeni \scriptstyle \mathbb R^n ze sobą dzięki istnieniu formy \scriptstyle \underline{\mathbb R^n} \times \mathbb R^n \to \mathbb R dającej izomorfizm \scriptstyle \underline{\mathbb R^n} \to \mathbb R^n. Dlatego choć iloczyn skalarny jest działaniem na wektorach, to operacje z jego wykorzystaniem muszą respektować utożsamienie wektorów z kowektorami (tj. działanie kowektorów na wektorach) – przekształceniami zachowującymi własności iloczynu skalarnego są przekształcenia ortogonalne (ich macierzamimacierze ortogonalne).

Inna natura obiektów manifestuje się w odmiennym ich zachowaniu przy zmianie bazy za pomocą przekształcenia nieortogonalnego (tj. przy nieortogonalnych automorfizmach przestrzeni liniowej, np. na prostoliniową, czy krzywoliniową): współrzędne wektorów przekształcają się w pewnym sensie „na przekór” (kontrawariantnie) przekształceniu przejścia między bazami, z kolei współrzędne kowektorów odwzorowywane są niejako „zgodnie” (kowariantnie) względem tego przekształcenia. Nie mniej obecność przestrzeni dualnej długo pozostawała niezauważona, a konieczność śledzenia wektorów i kowektorów stała się jednym z powodów, dla których preferuje się operowanie na przestrzeniach bez wybranych baz.

Podobnie można określić przestrzeń współrzędnych zespolonych w przypadku ciała liczb zespolonych i rozważać iloczyn skalarny dany jednak nieco innym wzorem, wówczas mówi się o przestrzeniach unitarnych, przekształceniach unitarnych i macierzach unitarnych.

Przypisy

  1. Za pomocą izomorfizmów \scriptstyle \mathrm{Mat}_{1 \times n} \to K^n lub \scriptstyle \mathrm{Mat}_{n \times 1} \to K^n będących rzutami na odpowiednie współrzędne, por. definicje ciągu i macierzy.
  2. Przykładowo rozszerzenie jej na „wektory wektorów” pozwala w szczególności na traktowanie wyznacznika \scriptstyle \det\colon \mathrm{Mat}_{n \times n} \to K macierzy typu \scriptstyle n \times n (np. macierzy Grama) jako formy wieloliniowej \scriptstyle \det\colon \left(\mathrm{Mat}_{n \times 1}\right)^n \to K jej wektorów kolumnowych, którym odpowiadają wektory przestrzeni \scriptstyle K^n, co daje przekształcenie \scriptstyle \det\colon \left(K^n\right)^n \to K (wyznacznik traktuje się czasem jako wielomian \scriptstyle \det\colon K^{n \cdot n} \to K). Daje to możliwość zdefiniowania go bez wyróżniania żadnego układu współrzędnych.
  3. Cofnięcie nazywane jest też z ang. „pullbackiem” (a nawet w formie spolszczonej: „pulbekiem”), bądź bardziej oficjalnie: produktem włóknistym; w geometrii różniczkowej analogicznie przekształcenie między przestrzeniami kostycznymi (które są liniowe) nazywa się odwzorowaniem kostycznym.
  4. Mnożenie macierzy przez skalar definiuje się zwykle jako oddzielne działanie, w przypadku wektorów kolumnowych i wierszowych można jednak do jego opisu użyć mnożenia macierzy – skalarom odpowiadają wtedy macierze \scriptstyle 1 \times 1, tj. wektory kolumnowe lub wierszowe o jednej współrzędnej – mają one te same własności mnożone lewostronnie przez wektor kolumnowy i prawostronnie przez wierszowy.
  5. Wybór przeciwny nie byłby tak niezwykły, jak mogłoby się wydawać na pierwszy rzut oka: sposób zapisu z argumentami z lewej strony przekształcenia stosuje się czasem w teorii grup, w szczególności do zapisu homomorfizmów grup abelowych.