Macierz przekształcenia liniowego

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Macierz przekształcenia liniowego – w algebrze liniowej macierz będąca wygodnym zapisem we współrzędnych przekształcenia liniowego dwóch skończenie wymiarowych przestrzeni liniowych nad tym samym ciałem z ustalonymi bazami. Dzięki temu, że mnożeniu macierzy oraz domnażaniu wektorów odpowiada składanie przekształceń i obliczanie wartości przekształcenia na wspomnianym wektorze, teoria macierzy staje się wygodnym językiem opisu przekształceń (w tym endomorfizmów) liniowych wyżej opisanych przestrzeni; jeśli nie wskazano żadnych baz, to każdą macierz o elementach z ciała można traktować jako przekształcenie liniowe między dwoma przestrzeniami współrzędnych.

Definicja[edytuj | edytuj kod]

Niech \scriptstyle U i \scriptstyle V będą dwiema przestrzeniami liniowymi nad ustalonym ciałem odpowiednio z bazami \scriptstyle A = (\mathbf a_1, \dots, \mathbf a_n) oraz \scriptstyle B = (\mathbf b_1, \dots, \mathbf b_m), zaś \scriptstyle \mathrm T\colon U \to V będzie przekształceniem liniowym. Macierzą przekształcenia \scriptstyle \mathrm T w bazach \scriptstyle A, B nazywa się taką macierz \scriptstyle \mathbf T_A^B = [t_{ij}] typu \scriptstyle m \times n o współczynnikach z danego ciała, że dla każdego \scriptstyle j = 1, \dots, n zachodzi

\mathrm T(\mathbf a_j) = \sum_{i = 1}^m t_{ij} \mathbf b_i,

tzn. w \scriptstyle j-tej kolumnie macierzy \scriptstyle \mathbf T_A^B stoją współrzędne wektora \scriptstyle \mathrm T(\mathbf a_j) w bazie \scriptstyle B. Macierz przekształcenia \scriptstyle \mathrm T w bazach \scriptstyle A, B będzie oznaczana także symbolem \scriptstyle \mathrm M(\mathrm T)_A^B.

Uwaga: w dalszej części artykułu wszystkie przestrzenie liniowe oraz macierze są zbudowane nad ustalonym ciałem \scriptstyle K.

Własności[edytuj | edytuj kod]

Odpowiedniość między przekształceniami liniowymi i ich macierzami
Information icon.svg Zobacz też: izomorfizm.

Przyporządkowanie każdemu przekształceniu liniowemu \scriptstyle \mathrm T jego macierzy \scriptstyle \mathrm M(\mathrm T)_A^B zadaje izomorfizm liniowy przestrzeni przekształceń liniowych \scriptstyle \mathrm L(V, W) oraz przestrzeni macierzy \scriptstyle \mathrm{Mat}_{m \times n}. Liniowość wynika wprost z własności działań na macierzach,

\mathrm M(\mathrm S + \mathrm T)_A^B = \mathrm M(\mathrm S)_A^B + \mathrm M(\mathrm T)_A^B,
\mathrm M(c\mathrm T)_A^B = c\mathrm M(\mathrm T)_A^B,

a ponadto każde przekształcenie liniowe \scriptstyle \mathrm T\colon U \to V jest zadane jednoznacznie przez podanie wartości na bazie, tzn. \scriptstyle \mathrm T(\mathbf a_1), \dots, \mathrm T(\mathbf a_n). Stąd odwzorowanie przyporządkowujące przekształceniom liniowym ich macierze jest wzajemnie jednoznaczne. Wynika stąd w szczególności, że jeśli \scriptstyle \dim U = n oraz \scriptstyle \dim V = m, to \scriptstyle \dim \mathrm L(U, V) = mn.

Mnożenie macierzy a obraz wektora w przekształceniu
 Osobne artykuły: mnożenie macierzyobraz.

Jeśli wektor \scriptstyle \mathbf u ma współrzędne \scriptstyle \mathbf u_A = [u_1, \dots, u_n] w bazie \scriptstyle A, zaś wektor \scriptstyle \mathbf v = \mathrm T(\mathbf u) ma współrzędne \scriptstyle \mathbf v_B = [v_1, \dots, v_m] w bazie \scriptstyle B, przy czym \scriptstyle \mathbf T_A^B = [t_{ij}] = \mathrm M(\mathrm T)_A^B, to

\begin{bmatrix} t_{11} & \dots & t_{1n} \\ \vdots & \ddots & \vdots \\ t_{m1} & \dots & t_{mn} \end{bmatrix} \begin{bmatrix} u_1 \\ \vdots \\ u_n \end{bmatrix} = \begin{bmatrix} v_1 \\ \vdots \\ v_m \end{bmatrix},

co można zapisać \scriptstyle \mathbf T_A^B \mathbf U_A = \mathbf V_B, gdzie \scriptstyle \scriptstyle \mathbf U_A, \mathbf V_B są macierzami jednokolumnowymi (tzw. wektorami kolumnowymi) odpowiadającymi wektorom \scriptstyle \scriptstyle \mathbf u_A, \mathbf v_B.[1]

Zamiana współrzędnych i jej macierze

W szczególnym przypadku, jeśli \scriptstyle A, B są bazami przestrzeni \scriptstyle V i macierz \scriptstyle \mathbf C_A^B = [c_{ij}] = \mathrm M(\mathrm{id})_A^B, gdzie \scriptstyle \mathrm{id} jest przekształceniem identycznościowym, to jeśli wektor \scriptstyle \mathbf u ma współrzędne \scriptstyle \mathbf u_A = [u_1, \dots, u_n] w bazie \scriptstyle A, zaś \scriptstyle \mathbf u_B = [v_1, \dots, v_n] są jego współrzędnymi w bazie \scriptstyle B, to

\begin{bmatrix} c_{11} & \dots & c_{1n} \\ \vdots & \ddots & \vdots \\ c_{n1} & \dots & c_{nn} \end{bmatrix} \begin{bmatrix} u_1 \\ \vdots \\ u_n \end{bmatrix} = \begin{bmatrix} v_1 \\ \vdots \\ v_n \end{bmatrix},

tzn. \scriptstyle \mathbf C_A^B \mathbf U_A = \mathbf U_B, gdzie \scriptstyle \scriptstyle \mathbf U_A, \mathbf U_B są macierzami odpowiadającymi wektorom współrzędnych \scriptstyle \scriptstyle \mathbf u_A, \mathbf u_B jw., co oznacza, że mnożenie przez \scriptstyle \mathbf C_A^B zamienia współrzędne wektora \scriptstyle \mathbf u w bazie \scriptstyle A na współrzędne w bazie \scriptstyle B. Stąd też macierz \scriptstyle \mathrm M(\mathrm{id})_A^B nazywa się macierzą zamiany współrzędnych (bądź macierzą przejścia) od \scriptstyle A do \scriptstyle B. Macierz \scriptstyle \mathrm M(\mathrm{id})_B^A zamiany współrzędnych od \scriptstyle B do \scriptstyle A dana jest jako jej macierz odwrotna \scriptstyle \bigl(\mathrm M(\mathrm{id})_A^B\bigr)^{-1}.

Mnożenie macierzy a składanie przekształceń

Jeśli \scriptstyle U, V, W są przestrzeniami liniowymi odpowiednio z bazami \scriptstyle A, B, C, a \scriptstyle \mathrm R\colon U \to V i \scriptstyle \mathrm S\colon V \to W są przekształceniami liniowymi, to

\mathrm M(\mathrm S \circ \mathrm R)_A^C = \mathrm M(\mathrm S)_B^C \mathrm M(\mathrm R)_A^B.[2]

Wynika stąd, że jeśli \scriptstyle \mathrm T\colon U \to V jest przekształceniem liniowym, układy \scriptstyle A, A' są bazami \scriptstyle U, układy \scriptstyle B, B' są bazami \scriptstyle V oraz jeśli \scriptstyle \mathbf A_{A'} i \scriptstyle \mathbf B'_B są macierzami zamiany współrzędnych odpowiednio z \scriptstyle A' do \scriptstyle A i z \scriptstyle B do \scriptstyle B', to

\mathbf T_{A'}^{B'} = \mathbf B^{B'}_B \mathbf T_A^B \mathbf A^{A}_{A'}.[3]
Rząd macierzy a rząd przekształcenia
 Osobny artykuł: rząd.

Jeśli \scriptstyle \mathrm T\colon U \to V jest przekształceniem liniowym, to dla każdej bazy \scriptstyle A przestrzeni \scriptstyle U i każdej bazy \scriptstyle B przestrzeni \scriptstyle V zachodzi

\mathrm r(\mathrm T) = \mathrm r\left(\mathbf T_A^B\right),

gdyż jeśli \scriptstyle \dim V = n, to przyporządkowanie wektorowi przestrzeni \scriptstyle V jego współrzędnych w bazie \scriptstyle B zadaje izomorfizm \scriptstyle V \to K^n, przy którym \scriptstyle \mathrm{im}\ \mathrm T przechodzi na podprzestrzeń rozpiętą na kolumnach macierzy \scriptstyle \mathbf T_A^B.

Przykłady[edytuj | edytuj kod]

Niech dane będą przestrzenie liniowe \scriptstyle \mathbb R^2 oraz \scriptstyle \mathbb R^3 (nad ciałem liczb rzeczywistych) oraz przekształcenie liniowe \scriptstyle \mathrm T\colon \mathbb R^2 \to \mathbb R^3 zadane wzorem

\mathrm T\bigl([a, b]\bigr) = [a, 2b, a + b]

w bazach standardowych. Macierz \scriptstyle \mathbf T przekształcenia \scriptstyle \mathrm T w bazach \scriptstyle A = \bigl([2, 0], [0, 3]\bigr) oraz \scriptstyle B = \bigl([1, 1, 1], [1, 1, 0], [1, 0, 0]\bigr) jest postaci

\mathbf T_A^B = \begin{bmatrix} \;\;\,2 & \;\;\,3 \\ -2 & \;\;\,3 \\ \;\;\,2 & -6 \end{bmatrix} ,

gdyż wektory bazowe \scriptstyle A przechodzą odpowiednio na wektory \scriptstyle [2, 0, 2] oraz \scriptstyle [0, 6, 3], zaś ich współrzędne w bazie \scriptstyle B mają postać

[2, 0, 2] = 2[1, 1, 1] - 2[1, 1, 0] + 2[1, 0, 0] = [2, -2, 2]_B

oraz

[0, 6, 3] = 3[1, 1, 1] + 3[1, 1, 0] - 6[1, 0, 0] = [3, 3, -6]_B.

Wartość \scriptstyle \mathrm T w bazie \scriptstyle B na wektorze \scriptstyle \mathbf x = [6;\ 0{,}3], który ma w \scriptstyle A współrzędne \scriptstyle \mathbf x_A = [3;\ 0{,}1] jest równa \scriptstyle \mathbf T_A^B\mathbf x_A, tzn.

\begin{bmatrix} \;\;\,2 & \;\;\,3 \\ -2 & \;\;\,3 \\ \;\;\,2 & -6 \end{bmatrix} \begin{bmatrix} 3 \\ 0{,}1 \end{bmatrix} = \begin{bmatrix} \;\;\,6{,}3 \\ -5{,}7 \\ \;\;\,5{,}4 \end{bmatrix}.

Endomorfizmy[edytuj | edytuj kod]

Przekształcenie liniowe \scriptstyle \mathrm E\colon V \to V skończeniewymiarowej przestrzeni liniowej \scriptstyle V nazywa się endomorfizmem (liniowym), jego macierzą w bazie \scriptstyle A jest \scriptstyle \mathbf E_A = \mathrm M(\mathrm E)_A^A. Wprost z definicji endomorfizmów wynika, że ich macierze są kwadratowe.

Jeśli \scriptstyle A, B są bazami \scriptstyle V, zaś \scriptstyle \mathbf A = \mathrm M(\mathrm E)_A^A oraz \scriptstyle \mathbf B = \mathrm M(\mathrm E)_B^B, to

\mathbf B = \mathrm M(\mathrm E)_B^B = \mathrm M(\mathrm{id} \circ \mathrm E \circ \mathrm{id})_B^B = \mathrm M(\mathrm{id}_V)_A^B \mathrm M(\mathrm E)_A^A \mathrm M(\mathrm{id})_B^A = \mathbf C^{-1}\mathbf{AC},

gdzie \scriptstyle \mathbf C = \mathrm M(\mathrm{id})_B^A jest macierzą zamiany współrzędnych z \scriptstyle B do \scriptstyle A, co wynika z ogólnej równości przedstawionej w Mnożenie macierzy a składanie przekształceń. Własność ta jest podstawą następującej definicji: dowolne macierze \scriptstyle \mathbf A, \mathbf B, dla których istnieje macierz odwracalna \scriptstyle \mathbf C spełniająca równość,

\mathbf B = \mathbf C^{-1}\mathbf{AC},

nazywa się macierzami podobnymi. Macierze te są podobne wtedy i tylko wtedy, gdy są macierzami tego samego endomorfizmu (co najwyżej w różnych bazach).

Do stwierdzenia podobieństwa macierzy można wykorzystać rząd, wyznacznik i ślad, które nie ulegają zmianie przy endomorfizmach – wielkości te zawiera się zwykle w wielomianie charakterystycznym opisującym dany endomorfizm. Postać i rodzaj endomorfizmu można z kolei uzyskać badając jego wektory i wartości własne. Niektóre endomorfizmy mają w pewnych bazach szczególnie prostą postać, jaką jest macierz diagonalna, czyli przyjmująca niezerowe wartości wyłącznie na głównej przekątnej – nazywa się je diagonalizowalnymi, przy czym elementami na przekątnej macierzy są wartości własne tego endomorfizmu.

Choć nie wszystkie macierze kwadratowe są diagonalizowalne, to istnieje szersza od nich klasa macierzy Jordana (czyli macierzy, które dają się sprowadzić do postaci Jordana), dla których orzeczenie, czy dane macierze w postaci Jordana są podobne jest wyjątkowo łatwe. Macierze te, podobnie jak macierze diagonalne, łatwo się potęguje. Twierdzenie Jordana mówi z kolei, że dla każdego endomorfizmu przestrzeni liniowej nad ciałem algebraicznie domkniętymi (np. liczbami zespolonymi) istnieje taka baza, w której macierz tego endomorfizmu ma postać Jordana. Ogólniejsze twierdzenie Frobeniusa umożliwia określenie podobieństwa dowolnych dwóch macierzy kwadratowych za cenę badania pierścienia wielomianów nad ustalonym ciałem, zamiast samego ciała. Wszystkie te twierdzenia są wnioskami z twierdzenia strukturalnego dla skończenie generowanych modułów nad dziedziną ideałów głównych.

Podobne narzędzia wykorzystuje się dla przestrzeni nieskończenie wymiarowych, jednak zamiast zbioru jego wartości własnych (nazywanego widmem punktowym bądź spektrum punktowym) bada się jego pełne widmo (spektrum). Uogólnieniem diagonalizacji są różnorodne twierdzenia spektralne.

Przypisy

  1. Z definicji macierzy przekształcenia wynika \scriptstyle \mathrm T(\mathbf u) = \mathrm T\left(\sum_{j = 1}^n u_j \mathbf a_j\right) = \sum_{j = 1}^n u_j \mathrm T(\mathbf a_j) = \sum_{j = 1}^n u_j \sum_{i = 1}^m t_{ij} \mathbf b_i = \sum_{i = 1}^m \left(\sum_{j = 1}^n t_{ij} u_j \right) \mathbf b_i = \sum_{i = 1}^m v_i \mathbf b_i = \mathbf v.
  2. Przyjmując oznaczenia \scriptstyle A = (\mathbf a_i)_i, B = (\mathbf b_j)_j, C = (\mathbf c_k)_k, oraz \scriptstyle \mathbf R_A^B = [r_{ij}] = \mathrm M(R)_A^B, \mathbf S_B^C = [s_{ij}] = \mathrm M(S)_B^C, \mathbf T_A^C = [t_{ij}] = \mathrm M(\mathrm S \circ \mathrm R)_A^C zachodzi \scriptstyle (\mathrm S \circ \mathrm R)(\mathbf a_j) = \mathrm S\left(\sum_{l = 1}^m r_{lj} \mathbf b_l\right) = \sum_{l = 1}^m r_{lj} \mathrm S(\mathbf b_l) = \sum_{l = 1}^m r_{lj} \left(\sum_{i = 1}^k s_{il} \mathbf c_j\right) = \sum_{i = 1}^k \left(\sum_{l = 1}^m r_{lj} t_{il}\right) \mathbf c_j = \sum_{i = 1}^k t_{ij} \mathbf c_j, tzn. \scriptstyle \mathbf T_A^C = \mathbf S_B^C \mathbf R_A^B, skąd wynika teza.
  3. Wynika to z równości \scriptstyle \mathbf T_{A'}^{B'} = \mathrm M(\mathrm T)_{A'}^{B'} = \mathrm M(\mathrm{id}_V \circ \mathrm T \circ \mathrm{id}_U)_{A'}^{B'} = \mathrm M(\mathrm{id}_V)_B^{B'} \mathrm M(\mathrm T)_A^B \mathrm M(\mathrm{id}_U)_{A'}^A = \mathbf B'_B \mathbf T_A^B \mathbf A_{A'}.