Macierz Grama

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania
Ujednoznacznienie Ten artykuł dotyczy macierzy (abstrakcyjnego) iloczynu skalarnego. Zobacz też: macierze ogólnych form dwuliniowej lub półtoraliniowej (bądź hermitowskiej).

Macierz Grama – w algebrze liniowej macierz związana z układem wektorów danej przestrzeni unitarnej, ułatwiająca opis tej przestrzeni; nosi ona nazwisko duńskiego matematyka Jørgena Pedersena Grama.

Choć zwykle wykorzystuje się do tego celu objętości prostopadłościanów wielowymiarowych, to do zdefiniowania miary Lebesgue'a na przestrzeni euklidesowej (a dokładniej przy określaniu miary zewnętrznej, która jest krokiem pośrednim) można użyć objętości równoległościanów wielowymiarowych (wyznaczanych przez dany układ wektorów) definiowanej za pomocą macierzy Grama. Objętość równoległościanu pojawia się także przy całkowaniu przez podstawienie (zamianie zmiennych) w całce Lebesgue'a, często jako tzw. forma objętości (antysymetryczna forma wieloliniowa najwyższego rzędu w danej przestrzeni liniowej), czyli zorientowany element objętości.

Jednym z najistotniejszych praktycznych zastosowań tej macierzy kwadratowej jest możliwość stwierdzenia, czy dany układ \scriptstyle k wektorów przestrzeni \scriptstyle n-wymiarowej jest liniowo niezależny − macierz ta musi mieć dodatni wyznacznik (dla \scriptstyle k = n wystarczy sprawdzić niezerowość wyznacznika samego układu wektorów) – geometrycznie odpowiada to sprawdzeniu, czy dany układ wektorów rozpina równoległościan o dodatniej objętości; kryterium to wykorzystuje się m.in. określania sterowalności i obserwowalności liniowego układu sterowania.

Definicja[edytuj | edytuj kod]

Niech dany będzie układ \scriptstyle A = \{\mathbf a_1, \dots, \mathbf a_k\} wektorów \scriptstyle n-wymiarowej przestrzeni unitarnej \scriptstyle (V, \scriptscriptstyle \langle \cdot , \cdot \rangle\scriptstyle) nad ciałem liczb rzeczywistych bądź zespolonych. Wektory układu \scriptstyle A wyrażone w bazie \scriptstyle B można wpisać jako kolumny macierzy \scriptstyle \mathbf A (zob. wektory kolumnowe)[1].

Macierzą Grama związaną z układem \scriptstyle A bądź macierzą \scriptstyle \mathbf A nazywa się macierz kwadratową stopnia \scriptstyle k nad ciałem liczb rzeczywistych

\mathbf G(\mathbf A) = \mathbf G(A) = \mathbf G(\mathbf a_1, \dots, \mathbf a_k) := \bigl[\langle \mathbf a_i, \mathbf a_j \rangle\bigr]_{ij}.

Wyznacznik tej macierzy nazywa się wyznacznikiem Grama wspomnianego układu wektorów (wspomnianej macierzy),

G(\mathbf A) = G(A) = G(\mathbf a_1, \dots, \mathbf a_k) := \det \mathbf G(A).

Własności[edytuj | edytuj kod]

Information icon.svg Zobacz też: liniowa niezależność.

W przypadku rzeczywistym z symetryczności dwuliniowego iloczynu skalarnego wynika \scriptstyle \langle \mathbf x_i, \mathbf x_j \rangle = \langle \mathbf x_j, \mathbf x_i \rangle (w przypadku zespolonym \scriptstyle \langle \mathbf x_i, \mathbf x_j \rangle = \overline{\langle \mathbf x_j, \mathbf x_i \rangle} na mocy hermitowskości półtoraliniowego iloczynu skalarnego) dla dowolnych \scriptstyle i, j, a więc macierz Grama również jest symetryczna (hermitowska, czyli samosprzężona). Niżej przedstawiono własności w przypadku zespolonym; dla przypadku rzeczywistego wystarczy pominąć kreski nad elementami i macierzami oznaczające sprzężenie zespolone, a sprzężoną hermitowsko macierz \scriptstyle \mathbf A^\star należy traktować jak macierz transponowaną \scriptstyle \mathbf A^\mathrm T.

Dla dowolnej macierzy \scriptstyle \mathbf A zachodzi

\mathbf G(\mathbf A) = \mathbf A^\star \mathbf A \quad \mbox{ oraz } \quad \mathbf G\left(\mathbf A^\mathrm T\right) = \mathbf{AA}^\star,

tzn. \scriptstyle \mathbf A^\star \mathbf A oraz \scriptstyle \mathbf{AA}^\star są macierzami Grama układu wektorów \scriptstyle A wpisanego odpowiednio jako kolumny i wiersze macierzy \scriptstyle \mathbf A.[2]

Jeśli \scriptstyle k = n, czyli \scriptstyle \mathbf A jest kwadratowa, to wyznacznik macierzy Grama jest nieujemną wielkością rzeczywistą, gdyż

G(\mathbf A) = \det(\mathbf A^\star \mathbf A) = \det\left(\overline{\mathbf A^\mathrm T}\right) \det(\mathbf A) = \overline{\det(\mathbf A)} \det(\mathbf A) = \bigl|\det(\mathbf A)\bigr|^2 \geqslant 0.

Układ \scriptstyle A jest liniowo niezależny wtedy i tylko wtedy, gdy wyznacznik \scriptstyle G(A) > 0.[3]

O tym, które z macierzy hermitowskich (symetrycznych) są macierzami Grama, czy też dokładniej: czy istnieje taka przestrzeń unitarna, dla której dana macierz hermitowska (symetryczna) jest macierzą Grama pewnej bazy tej przestrzeni, mówi kryterium Sylvestera. Formalnie warunek ten umożliwia sprawdzenie, czy dana macierz dwuliniowej formy hermitowskiej (symetrycznej) jest dodatnio określona − forma ta wówczas jest iloczynem skalarnym na tej przestrzeni.

Objętość[edytuj | edytuj kod]

Niech dany będzie liniowo niezależny układ wektorów \scriptstyle A = \{\mathbf a_1, \dots, \mathbf a_k\} przestrzeni unitarnej \scriptstyle V wymiaru \scriptstyle n. Jeśli \scriptstyle \mathrm R(A) oznacza \scriptstyle k-wymiarowy równoległościan rozpięty na \scriptstyle A, to jego \scriptstyle k-wymiarową objętością nazywa się liczbę

\bigl|\mathrm R(A)\bigr|_k = \sqrt{G(A)}.

Ponadto przyjmuje się \scriptstyle |\scriptscriptstyle \mathrm R(A)\scriptstyle|_l = 0 dla \scriptstyle l > k oraz \scriptstyle |\scriptscriptstyle \mathrm R(A)\scriptstyle |_l = \infty dla \scriptstyle l < k.

Niech \scriptstyle A' = \{\mathbf a_1, \dots, \mathbf a_{k-1}\}. Jeśli \scriptstyle \mathbf c jest rzutem prostopadłym wektora \scriptstyle \mathbf a_k na dopełnienie ortogonalne \scriptstyle \mathrm{lin}(A')^\perp podprzestrzeni rozpiętej przez \scriptstyle A', to wtedy

G(A) = G(A') \cdot \|\mathbf c\|^2.[4]

Dla przestrzeni rzeczywistych twierdzenie to można wysłowić w przypadku dwuwymiarowym w następujący sposób: pole równoległoboku równe jest iloczynowi długości podstawy i wysokości; w przypadku trójwymiarowym: objętość równoległościanu jest równa iloczynowi pola podstawy i wysokości. W ogólności zaś:

\bigl|\mathrm R(A)\bigr|_k = \bigl|\mathrm R(A')\bigr|_{k-1} \cdot \|\mathbf c\|.

Zgodnie z uwagami z poprzedniej sekcji, jeśli \scriptstyle V = \mathbb R^n ze standardowym iloczynem skalarnym, to dla dowolnej macierzy odwracalnej \scriptstyle \mathbf A = [a_{ij}] moduł wyznacznika

|\det \mathbf A| = \sqrt{G(\mathbf a_1, \dots, \mathbf a_n)},

gdzie \scriptstyle \mathbf a_j = (a_{1j}, \dots, a_{nj}) dla \scriptstyle j = 1, \dots, n można jest \scriptstyle n-wymiarową objętością równoległościanu w \scriptstyle \mathbb R^n rozpiętego na kolumnach bądź wierszach macierzy \scriptstyle \mathbf A. Biorąc pod uwagę orientację bazy \scriptstyle \mathbf a_1, \dots, \mathbf a_n wyznacznik \scriptstyle \det \mathbf A należy interpretować jako \scriptstyle n-wymiarową zorientowaną objętość wspomnianego równoległościanu. Jeśli macierz \scriptstyle \mathbf A nie jest odwracalna, to jej wiersze (i kolumny) są liniowo zależne, skąd \scriptstyle \det \mathbf A = 0. Analogiczną interpretację uzyskuje się w przypadku przestrzeni \scriptstyle V = \mathbb C^n.

Iloczyn wektorowy[edytuj | edytuj kod]

Wybór iloczynu skalarnego i orientacji w \scriptstyle n-wymiarowej przestrzeni liniowej \scriptstyle V nad \scriptstyle \mathbb R umożliwia podanie metody dopełniania liniowo niezależnego układu \scriptstyle n-1 wektorów do bazy tej przestrzeni. Iloczynem wektorowym liniowo niezależnego układu \scriptstyle A' = \{\mathbf a_1, \dots, \mathbf a_{n-1}\} nazywa się taki wektor \scriptstyle \mathbf b zorientowanej przestrzeni unitarnej rzeczywistej, że

  • jeśli \scriptstyle A' jest liniowo zależny, to \scriptstyle \mathbf b = \mathbf 0,
  • jeśli \scriptstyle A' jest liniowo niezależny, to \scriptstyle \mathbf b \in \mathrm{lin}(A')^\perp oraz \scriptstyle \|\mathbf b\| = \sqrt{G(A')}, przy czym baza \scriptstyle \{A', \mathbf b\} jest dodatnio zorientowana.

Innymi słowy wektor \scriptstyle \mathbf b, oznaczany zwykle \scriptstyle \mathbf a_1 \times \dots \times \mathbf a_{n-1}, jest prostopadły do każdego z wektorów układu \scriptstyle A', jego moduł jest równy objętości równoległoboku rozpiętego na \scriptstyle A', a dołączony na końcu \scriptstyle A' tworzy z wektorami tego układu bazę dodatnio zorientowaną.

Uogólnienia[edytuj | edytuj kod]

W przypadku zespolonych przestrzeni unitarnych iloczyn skalarny jest dodatnio określoną (a stąd niezdegenerowaną) półtoraliniową formą hermitowską (tzn. samosprzężoną), w przestrzeniach rzeczywistych iloczyn skalarny jest dodatnio określoną dwuliniową formą symetryczną. Rezygnując z warunku dodatniej określoności i hermitowskości (bądź symetryczności) można rozpatrywać przestrzeń z formą półtoraliniową (dwuliniową) − macierzy Grama odpowiada wtedy macierz tej formy w ustalonej bazie. Przestrzeń liniową z symetryczną formą dwuliniową nazywa się przestrzenią ortogonalną. Badanie form kwadratowych pochodzących od form dwuliniowych umożliwia przykładowo klasyfikację właściwych hiperpowierzchni właściwych stopnia 2 nazywanych kwadrykami, w tym hiperpowierzchni właściwych przestrzeni euklidesowych wymiaru 2 i 3, tzn. pewnych krzywych w przestrzeni \scriptstyle \mathbb R^2 oraz pewnych powierzchni w \scriptstyle \mathbb R^3.

Iloczyn mieszany trzech wektorów trójwymiarowej przestrzeni liniowej można zdefiniować za pomocą wyznacznika macierzy, w której wektory te są kolumnami (bądź wierszami) albo niezależnie od układu współrzędnych za pomocą iloczynu zewnętrznego \scriptstyle \wedge tych wektorów. Podobnie dla równoległościanu zorientowanego

\mathrm R(\mathbf a_1, \dots, \mathbf a_n) = \mathbf a_1 \wedge \dots \wedge \mathbf a_n

można określić również jego \scriptstyle n-wymiarową objętość wzorem

\bigl|\mathrm R(\mathbf a_1, \dots, \mathbf a_n)\bigr|_n = \|\mathbf a_1 \wedge \dots \wedge \mathbf a_n\|,

skąd wartość wyznacznika Grama można określić niezależnie od współrzędnych wektorów jako

G(\mathbf a_1, \dots, \mathbf a_n) = \|\mathbf a_1 \wedge \dots \wedge \mathbf a_n\|^2.

Bibliografia[edytuj | edytuj kod]

  • Franciszek Leja: Rachunek różniczkowy i całkowy. Warszawa: PWN, 1976.
  • S. Zakrzewski: Algebra i geometria. Warszawa.

Przypisy

  1. Każdy z wektorów układu \scriptstyle A można wyrazić w bazie ortonormalnej \scriptstyle B = \{\mathbf b_1, \dots, \mathbf b_n\}, tzn. \scriptstyle \mathbf a_j = \sum_{i = 1}^n a_{ij} \mathbf b_i dla \scriptstyle j = 1, \dots, k. Wówczas \scriptstyle \mathbf A = [a_{ij}] jest macierzą typu \scriptstyle n \times k
  2. Niech wektory \scriptstyle \mathbf a_1, \dots, \mathbf a_k wyrażone w bazie ortonormalnej \scriptstyle \mathbf b_1, \dots, \mathbf b_n odpowiadają kolumnom macierzy \scriptstyle \mathbf A. Ponieważ \scriptstyle \langle \mathbf b_i, \mathbf b_j \rangle = 1 dla \scriptstyle i = j oraz \scriptstyle \langle \mathbf b_i, \mathbf b_j \rangle = 0 w pozostałych przypadkach, to
    \scriptstyle \langle \mathbf a_r, \mathbf a_s \rangle = \left\langle \sum_{i = 1}^n \mathbf a_{ir} \mathbf b_i, \sum_{j = 1}^n \mathbf a_{js} \mathbf b_j \right\rangle = \sum_{i,j = 1}^n \mathbf a_{ir} \overline{\mathbf a_{js}} \langle \mathbf b_i, \mathbf b_j \rangle = \sum_{i = 1}^n \mathbf a_{ir} \overline{\mathbf a_{is}} jest wyrazem \scriptstyle rs macierzy \scriptstyle \mathbf A^\star \mathbf A.
  3. Niech \scriptstyle Y będzie podprzestrzenią unitarną rozpiętą przez układ wektorów \scriptstyle A = \{\mathbf a_1, \dots, \mathbf a_k\} o współrzędnych w bazie ortonormalnej \scriptstyle B = \{\mathbf b_1, \dots, \mathbf b_n\}. Jeśli układ \scriptstyle A jest liniowo niezależny, to \scriptstyle k = n, a więc jest on bazą przestrzeni \scriptstyle Y i macierz \scriptstyle \mathbf A jest odwracalna, gdyż \scriptstyle \mathbf A = \mathrm M(\mathrm{id})_A^B. Stąd \scriptstyle \det \mathbf A \ne 0, czyli \scriptstyle G(A) = |\det \mathbf A|^2 > 0. Z drugiej strony jeśli układ \scriptstyle A jest liniowo zależny, to liniowo zależne są również kolumny \scriptstyle \mathbf A. Z interpretacji mnożenia macierzy metodą współczynniki-wektory kolumny macierzy \scriptstyle \mathbf A^\star \mathbf A są kombinacjami liniowymi kolumn macierzy \scriptstyle \mathbf A, skąd wynika, że kolumny \scriptstyle \mathbf A^\star \mathbf A również są liniowo zależne, a więc \scriptstyle G(A) = 0.
  4. Niech \scriptstyle W = \mathrm{lin}(A'), wtedy \scriptstyle V = W \oplus W^\perp. Niech \scriptstyle \mathbf a_k = \mathbf b + \mathbf c, gdzie \scriptstyle \mathbf b \in W, zaś \scriptstyle \mathbf c \in W^\perp. Wówczas wyrazy postaci \scriptstyle \langle \mathbf b + \mathbf c, \cdot \rangle w ostatnim wierszu oraz wyrazy postaci \scriptstyle \langle \cdot, \mathbf b + \mathbf c \rangle w ostatniej kolumnie rozkładają się na sumy \scriptstyle \langle \mathbf b, \cdot \rangle + \langle \mathbf c, \cdot \rangle oraz \scriptstyle \langle \cdot, \mathbf b \rangle + \langle \cdot, \mathbf c \rangle. Składniki zawierające \scriptstyle \mathbf b można pominąć przy liczeniu wyznacznika, gdyż ostatni wiersz je zawierający jest kombinacją liniową pierwszych \scriptstyle k - 1 wierszy macierzy \scriptstyle \mathbf G(A) (gdyż \scriptstyle \mathbf b jest kombinacją liniową \scriptstyle A'), podobnie ma się rzecz z ostatnią kolumną. W związku z tym
    \scriptstyle \mathbf G(A) = \left[\begin{smallmatrix} \langle \mathbf a_1, \mathbf a_1 \rangle & \dots & \langle \mathbf a_1, \mathbf a_{k-1} \rangle & \langle \mathbf c, \mathbf a_1 \rangle \\ \vdots & \ddots & \vdots & \vdots \\ \langle \mathbf a_{k-1}, \mathbf a_1 \rangle & \dots & \langle \mathbf a_{k-1}, \mathbf a_{k-1} \rangle & \langle \mathbf c, \mathbf a_{k-1} \rangle \\ \langle \mathbf c, \mathbf a_1 \rangle & \dots & \langle \mathbf c, \mathbf a_{k-1} \rangle & \langle \mathbf c, \mathbf c \rangle \end{smallmatrix}\right],
    a ponieważ \scriptstyle \mathbf c \perp \mathbf a_i czyli \scriptstyle \langle \mathbf c, \mathbf a_i \rangle = 0 dla \scriptstyle i = 1, \dots, k-1, to \scriptstyle G(A) = G(A') \cdot \|\mathbf c\|^2.