Przekształcenie liniowe

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj
Ujednoznacznienie Ten artykuł dotyczy pojęcia stosowanego w matematyce wyższej. Zobacz też: funkcja liniowa w matematyce elementarnej.

Przekształcenie liniowe – w algebrze liniowej funkcja między przestrzeniami liniowymi (nad ustalonym ciałem) zachowująca ich strukturę; z punktu widzenia algebry jest to zatem homomorfizm (a z punktu widzenia teorii kategoriimorfizm kategorii) przestrzeni liniowych nad ustalonym ciałem. W przypadku przestrzeni skończonego wymiaru z ustalonymi bazami do opisu przekształceń liniowych między nimi stosuje się zwykle macierze (zob. wybór baz).

Przekształcenia liniowe znajdują zastosowanie m.in. w zagadnieniach linearyzacji, czy aproksymacji liniowej, np. za pomocą pochodnych (również wielowymiarowych, np. w analizie wielowymiarowej); przytłaczająca większość zastosowań macierzy wynika z faktu, iż reprezentują one pewne przekształcenia liniowe (w przypadku skończeniewymiarowym).

Choć w większości wypadków słowa „funkcja”, „przekształcenie” i „odwzorowanie” są synonimami, to termin funkcja liniowa zarezerwowany jest dla funkcji parametryzującej na płaszczyźnie (zwykle euklidesowej) prostą, zaś sformułowania przekształcenie liniowe i odwzorowanie liniowe odnoszą się do opisanej w tym artykule funkcji przekształcającej proste w proste lub punkt (każda z tych figur musi przechodzić przez początek przestrzeni nazywany wektorem zerowym); w dalszej części obie nazwy będą stosowane wymiennie – powiązane nazwy opisano w oddzielnej sekcji.

Definicja[edytuj | edytuj kod]

Niech \scriptstyle K oznacza pewne ciało (np. liczby rzeczywiste, czy zespolone), a \scriptstyle U i \scriptstyle V będą przestrzeniami liniowymi nad tym ciałem. Funkcję \scriptstyle \mathrm A\colon U \to V nazywa się przekształceniem liniowym, jeżeli jest

Powyższe łączy się często w jeden, równoważny z nimi warunek liniowości,

\mathrm A(c\mathbf x + d\mathbf y) = c\mathrm A(\mathbf x) + d\mathrm A(\mathbf y),

przy czym istnieje wiele jego równoważnych wariantów; w ogólności przekształcenia liniowe są najogólniejszymi funkcjami między \scriptstyle U,\ V zachowującymi kombinacje liniowe (można to dowieść z powyższych warunków za pomocą indukcji lub przyjąć za definicję).

Własności[edytuj | edytuj kod]

Information icon.svg Osobne artykuły: obraz i przeciwobraz, jądrorząd macierzy.

Na każdą funkcję można nałożyć dodatkowe warunki, np. różnowartościowości, odwzorowywania na całą przeciwdziedzinę czy odwracalności. W przypadku przekształceń liniowych własności te silnie ze sobą współgrają: odwzorowanie liniowe (homomorfizm) mające kolejno jedną ze wspomnianych własności nazywa się odpowiednio monomorfizmem, epimorfizmem i izomorfizmem (wszystkie uściśla się słowem „liniowy”, jeśli jest to konieczne). Ponadto przekształcenie liniowe przestrzeni w siebie nazywa się jej endomorfizmem; jeżeli jest ono dodatkowo odwracalne (jest izomorfizmem), to nazywa się je automorfizmem danej przestrzeni.

Istnieje też szereg pojęć służących do opisu przekształceń liniowych i przestrzeni, na których są one określone. Definiuje się je za pomocą pojęć kombinacji liniowej, bazy i wymiaru, do najważniejszych należą:

  • jądro, czyli przeciwobraz wektora zerowego (należy do każdej przestrzeni liniowej);
  • rząd, definiowany jako wymiar obrazu całej przestrzeni.

Za ich pomocą można scharakteryzować każdy z powyższych rodzajów homomorfizmów: monomorfizm ma trywialne jądro (tj. złożone wyłącznie z wektora zerowego), epimorfizm ma pełny rząd (tzn. równy wymiarowi przeciwdziedziny), a izomorfizm jest zarazem mono- jak i epimorfizmem. Ważnym wynikiem dotyczącym przekształceń liniowych jest twierdzenie Sylvestera o rzędzie, mianowicie iż wymiar dziedziny jest równy sumie wymiarów obrazu i jądra przekształcenia[1]. Wynika stąd ważna obserwacja dotycząca izomorfizmów: wszystkie przestrzenie liniowe (nad ustalonym ciałem) równego wymiaru są izomorficzne, skąd wynika, iż wymiar jest niezmiennikiem izomorfizmów. Ponadto jeśli przekształcenie liniowe określone jest między dwoma przestrzeniami liniowymi równego, skończonego wymiaru, to z twierdzenia wynika, iż każdy monomorfizm, czy epimorfizm jest izomorfizmem – innymi słowy w tym wypadku pojęcia mono-, epi- i izomorfizmu wynikają z siebie wzajemnie.

Twierdzenie o wykresie charakteryzuje przekształcenia liniowe spośród wszystkich funkcji określonych między dwoma przestrzeniami liniowymi: odwzorowanie \scriptstyle \mathrm T\colon U \to V jest liniowe wtedy i tylko wtedy, gdy jej wykres, czyli zbiór par (\scriptstyle \mathbf u,\ \mathrm T(\mathbf u)\displaystyle), jest podprzestrzenią liniową przestrzeni \scriptstyle U \times V (której wykres jest zawsze podzbiorem).

Pojęcia topologiczne, czy analityczne, takie jak ciągłość, czy różniczkowalność nie przydają niczego w przypadku przestrzeni skończonego wymiaru – przekształcenia liniowe między nimi są ciągłe i gładkie na całej dziedzinie; sytuacja zmienia się diametralnie, jeśli rozpatruje się przestrzenie nieskończeniewymiarowe, zob. osobną sekcję.

Wybór baz[edytuj | edytuj kod]

Jeśli \scriptstyle U, V są przestrzeniami liniowymi skończonego wymiaru, to możliwe jest opisanie przekształcenia liniowego między nimi za pomocą macierzy; niech \scriptstyle \dim U = n i \scriptstyle \dim V = m. Wybranie baz \scriptstyle (\mathbf a_i),\ (\mathbf b_j) odpowiednio w każdej z tych przestrzeni prowadzi do wskazania izomorfizmów \scriptstyle U \to K^n oraz \scriptstyle V \to K^m w przestrzenie współrzędnych (będące przestrzeniami liniowymi). Odwrotnie, każda macierz typu \scriptstyle m \times n opisuje przekształcenie liniowe \scriptstyle K^n \to K^m, a dzięki wspomnianym izomorfizmom (wyborom baz) również \scriptstyle U \to V w danych bazach.

Jeśli \scriptstyle \mathbf A jest macierzą przekształcenia liniowego \scriptstyle \mathrm A, a macierz jednokolumnowa \scriptstyle \mathbf X odpowiada wektorowi przestrzeni \scriptstyle \mathbf x[2], to działaniu przekształcenia liniowego na wektor \scriptstyle \mathrm A(\mathbf x) odpowiada mnożenie macierzy \scriptstyle \mathbf{AX}. Podobnie mnożenie macierzy odpowiada składaniu przekształceń.

W ten sposób ogólna teoria macierzy może być wykorzystana do opisu przekształceń liniowych. Istnieją dwa zasadnicze powody, dla których rozpatruje się ogólne przekształcenia liniowe zamiast (obok) ich macierzy. Macierze nie spełniają swego zadania w przestrzeniach liniowych nieskończonego wymiaru, gdzie zapis ten nie przydaje nic do ogólnego rozumienia nie ułatwiając przeprowadzania konkretnych rachunków jak ma to miejsce w przypadku skończeniewymiarowym. Drugim powodem jest fakt, iż istnieją własności, które łatwiej traktować w bardziej abstrakcyjny sposób; zbędne jest przykładowo dowodzenie, iż dana własność nie zależy od wyboru baz – w szczególności, iż istnieją przestrzenie (zwykle nieskończeniewymiarowe), w których wybór bazy nie jest kanoniczny, tj. nie istnieje naturalny izomorfizm z przestrzenią współrzędnych (lub jej nieskończonym odpowiednikiem, zob. przykłady przestrzeni liniowych).

Endomorfizmy[edytuj | edytuj kod]

Zbiór \scriptstyle \mathrm{End}\ V wszystkich endomorfizmów przestrzeni \scriptstyle V tworzy pierścień nazywany po prostu pierścieniem endomorfizmów \scriptstyle V. Do opisu endomorfizmów liniowych, nazywanych niekiedy „operatorami liniowymi”, na przestrzeniach skończonego wymiaru i ich macierzy kwadratowych stosuje się często pojęcia wyznacznika i śladu. Zwykle definiuje się je dla macierzy dowodząc ich niezależności od wyboru bazy, możliwe jest jednak zdefiniowanie bez wyboru bazy dla przekształceń liniowych, jednak wtedy konieczne jest podanie przepisu na ich obliczenie – wyraża się ją wtedy za pomocą macierzy w ustalonej bazie – odzwierciedla równoważność obu definicji. Niezmienniczość tych pojęć można tłumaczyć za pomocą podprzestrzeni niezmienniczych, w tym wektorów własnych i stowarzyszonych z nimi wartości własnych, które opisują kierunki zachowywane przez dane przekształcenie liniowe i stosunki jednokładności w tychże kierunkach: wyznacznik jest iloczynem wartości własnych, a ślad – ich sumą. Rząd jest wtedy równy liczbie niezerowych wartości własnych. Jeśli choć jedna wartość własna jest zerowa, to wyznacznik również jest zerowy – przekształcenie (lub macierz) nazywa się wtedy osobliwym (lub zdegenerowanym; a rząd nie jest pełny, skąd przekształcenie nie jest epimorfizmem). Dowodzi się, że osobliwość jest równoważna nieodwracalności.

Twierdzenie o endomorfizmie

Jeśli \scriptstyle V jest przestrzenią liniową skończonego wymiaru, zaś \scriptstyle \mathrm E \in \mathrm{End}\ V oraz \scriptstyle \lambda_1, \dots, \lambda_k są wszystkimi, parami różnymi wartościami własnymi tego endomorfizmu, to następujące warunki są równoważne:

  • \scriptstyle \mathrm E jest endomorfizmem,
  • \scriptstyle V = V(\lambda_1, \mathrm E) \oplus \dots \oplus V(\lambda_k, \mathrm E),
  • \scriptstyle \dim V = \dim V(\lambda_1, \mathrm E) + \dots + \dim V(\lambda_k, \mathrm E),

gdzie \scriptstyle \oplus oznacza sumę prostą przestrzeni liniowych, a \scriptstyle V(\lambda_i, \mathrm E) jest podprzestrzenią niezmienniczą stowarzyszoną z wartością własną \scriptstyle \lambda_i endomorfizmu \scriptstyle \mathrm E.

Z powyższych uwag wynika, że wyznacznik, ślad i rząd są niezmiennikami endomorfizmów. Wszystkie te informacje zawarte są w wielomianie charakterystycznym przekształcenia (bądź macierzy): pierwiastkami tego wielomianu są wartości własne. Środki te okazują się niewystarczające w przypadku nieskończeniewymiarowym, gdzie pojęcia te mają odpowiednie uogólnienia (zob. Wymiar nieskończony).

Automorfizmy[edytuj | edytuj kod]

Information icon.svg Osobne artykuły: automorfizmpełna grupa liniowa.

W ogólności automorfizmy liniowe, czyli odwracalne przekształcenie liniowe przestrzeni na siebie, opisują „symetrie” przestrzeni takie jak opisane wyżej (liniowe) zmiany bazy. Ponieważ złożenie automorfizmów jest automorfizmem, jest łączne z definicji, przekształcenie tożsamościowe jest automorfizmem, a dla każdego automorfizmu istnieje automorfizm do niego odwrotny, to zbiór automorfizmów \scriptstyle \mathrm{Aut}\ V przestrzeni \scriptstyle V tworzy grupę nazywaną ogólną lub pełną grupą liniową \scriptstyle \mathrm{GL}(V) przestrzeni \scriptstyle V.

Przykłady[edytuj | edytuj kod]

Do najprostszych przykładów należą funkcje jednorodne (na mocy definicji), np. stałe \scriptstyle \mathbf x \to \mathbf c (monomorfizm/epimorfizm tylko dla odwzorowania w przestrzeń trywialną), tożsamościowa \scriptstyle \mathbf x \to \mathbf x (monomorfizm dla wymiaru dziedziny mniejszego od przeciwdziedziny, izomorfizm dla równego, epimorfizm dla większego) czy jednokładność \scriptstyle \mathbf x \to a\mathbf x (jak poprzednio dla niezerowego współczynnika i nieodwracalne dla zerowego, przy nietrywialnej dziedzinie). Ze względu na swoje własności pochodna \scriptstyle f \to \mathrm Df również jest liniowa (w wielu swych uogólnieniach jest to warunek na nie nakładany; odwzorowanie nieodwracalne), gdzie \scriptstyle f jest funkcją różniczkowalną (dla ustalenia uwagi: rzeczywistą; tworzą one przestrzeń funkcyjną, która jest liniowa).

Przykładem przekształcenia liniowego jest tzw. forma liniowa (znana także jako funkcjonał liniowy), czyli odwzorowanie przestrzeni liniowej w ciało jej skalarów (które może być traktowane jako jednowymiarowa przestrzeń liniowa nad tym ciałem). Formą liniową jest np. całka (w wielu swych odmianach) ze względu na całkowalną funkcję podcałkową (dla ustalenia uwagi: rzeczywistą, ciągłą na ograniczonym przedziale całkowania; również tworzą one liniową przestrzeń funkcyjną).

Przestrzenie przekształceń[edytuj | edytuj kod]

Przekształcenia liniowe \scriptstyle U \to V tworzą przestrzeń liniową z działaniami określonymi „punktowo”, tj. które wykonywane są dla każdego wektora w ten sam sposób:

(\mathrm A + \mathrm B)(\mathbf x) = \mathrm A(\mathbf x) + \mathrm B(\mathbf x)

oraz

(c \mathrm A)(\mathbf x) = c\mathrm A(\mathbf x).

Jeśli \scriptstyle \dim U = n i \scriptstyle \dim V = m, to zgodnie z rozważaniami w sekcji Wybór baz każde przekształcenie \scriptstyle U \to V jest izomorficzne z pewnym przekształceniem \scriptstyle K^n \to K^m, a co za tym idzie, z macierzą \scriptstyle \{1, \dots, m\} \times \{1, \dots, n\} \to K. Oznacza to, że przestrzeń \scriptstyle \mathrm L(U, V) wszystkich przekształceń liniowych \scriptstyle U \to V jest izomorficzna z przestrzenią \scriptstyle \mathrm L(K^n, K^m), która jest z kolei izomorficzna z przestrzenią \scriptstyle \mathrm{Mat}_{m \times n}(K) macierzy typu \scriptstyle m \times n. Wynika stąd, że każda z tych przestrzeni ma (zachowywany przy izomorfizmach) wymiar \scriptstyle mn. Jeśli choć jedna z liczb \scriptstyle m, n jest nieskończona, to powyższa równość dalej pozostaje w mocy – wymiar przestrzeni przekształceń również jest wtedy nieskończony.

Wymiar nieskończony[edytuj | edytuj kod]

Bezpośrednim uogólnieniem przestrzeni współrzędnych na nieskończoną liczbę wymiarów jest nieskończona przestrzeń współrzędnych, w której tylko skończenie wiele współrzędnych jest różnych od zera, co umożliwia branie dowolnie długich, lecz mimo wszystko skończonych kombinacji liniowych; przykładem może być przestrzeń wielomianów jednej zmiennej (o współczynnikach z ustalonego ciała). Przekształcenia liniowe są określone w nich zupełnie analogicznie jak wyżej, jednak nie mają one swoich dobrych własności, np. endomorfizm przestrzeni nieskończonego wymiaru będący monomorfizmem nie musi być epimorfizmem (i na odwrót; zob. operator przesunięcia).

Opisem przestrzeni liniowych nieskończonego wymiaru, które dodatkowo wyposażone są w jakąś strukturę umożliwiającą rozpatrywanie nieskończonych szeregów odpowiadających kombinacjom liniowym, zajmuje się dział matematyki nazywany analizą funkcjonalną. Klasyczna teoria dotyczy przestrzeni unormowanych, czyli przestrzeni liniowych ze zdefiniowanym pojęciem „długości” wektora (można w niej w naturalny sposób określić strukturę metryczną, czyli wprowadzić pojęcie „odległości”); aby zapewnić istnienie wektorów, dla których wspomniane szeregi są zbieżne zakłada się, że przestrzenie te są zupełne – przestrzenie takie nazywa się przestrzeniami Banacha. Z przyczyn historycznych przekształcenia liniowe zwykło nazywać się w analizie funkcjonalnej „operatorami liniowymi”, a formy liniowe – „funkcjonałami liniowymi” (skąd wziął swą nazwę sam dział).

Jeśli \scriptstyle U i \scriptstyle V są unormowanymi przestrzeniami liniowymi, to ograniczoność operatora definiuje się za pomocą warunku ograniczającego normę obrazu dowolnego wektora przez pewną wielokrotność normy tego wektora. Operator liniowy jest ograniczony wtedy i tylko wtedy, gdy jest ciągły (pojęcie to można zdefiniować w ogólniejszych przestrzeniach liniowo-topologicznych). W przestrzeniach Banacha ciągłość globalna jest równoważna ciągłości lokalnej, jak również przeprowadzaniu ciągów zbieżnych do zera w ciągi ograniczone. Rozpatrywanie operatorów ograniczonych i ciągłych w przestrzeniach skończonego wymiaru mija się z celem, gdyż wszystkie przekształcenia liniowe między nimi są ciągłe i ograniczone, co wynika z równoważności norm na tych przestrzeniach.

Wśród ważnych twierdzeń dotyczących przestrzeni nieskończonego wymiaru można wymienić twierdzenie Hahna-Banacha, twierdzenie Banacha-Steinhausa, twierdzenie o wykresie domkniętym, czy twierdzenie o odwzorowaniu otwartym. Pojęcia wyznacznika i śladu uogólnia się na te przestrzenie za pomocą wyznacznika Fredholma i śladu funkcyjnego dla szczególnego rodzaju tzw. operatorów śladowych; innym rozszerzeniem jest wyznacznik funkcyjny. Wektory i wartości własne uogólniają się poprzez widmo (spektrum) operatora; diagonalizacji różnymi metodami odpowiadają wtedy różnorodne twierdzenia spektralne.

Uogólnienia[edytuj | edytuj kod]

Jak wspomniano we wstępie, przekształcenia liniowe są homomorfizmami szczególnych struktur algebraicznych – przestrzeni liniowych, które z punktu widzenia algebry są modułami nad ciałem, podczas gdy w ogólności skalary modułów mogą należeć do ogólniejszej struktury nazywanej pierścieniem (tworzą go np. liczby całkowite). Wszystkie wyniki natury czysto algebraicznej niewykorzystujące liniowej niezależności są prawdziwe także w teorii modułów.

Przekształcenia liniowe można traktować jako przypadki szczególne innych przekształceń geometrycznych, najbliższym jej uogólnieniem jest przekształcenie afiniczne określane na przestrzeniach afinicznych; jego odpowiednikiem dla przestrzeni rzutowych jest przekształcenie rzutowe itd.

Zobacz też[edytuj | edytuj kod]

Przypisy

  1. W istocie zachodzi więcej: dziedzina jest izomorficzna z sumą prostą obrazu i jądra.
  2. Macierz \scriptstyle \mathbf X może być ona traktowana jako wektor współrzędnych, nazywany często wektorem kolumnowym, wektora \scriptstyle \mathbf x; wspomniana odpowiedniość jest izomorfizmem odpowiednich przestrzeni liniowych: przestrzeni macierzy jednokolumnowych i współrzędnych (zob. przestrzeń współrzędnych).