Kombinacja liniowa

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Kombinacja liniowa – jedno z podstawowych pojęć algebry liniowej i powiązanych z nią działów matematyki. W dalszej części pojęcie to będzie omawiane głównie w kontekście przestrzeni liniowych nad ciałem z uogólnieniami na końcu artykułu.

Definicja[edytuj | edytuj kod]

Niech \mathbf{v_1, v_2, \dots, v_n} będą elementami przestrzeni liniowej V nad pewnym ciałem, a a_1, a_2, \dots a_n będą elementami tego ciała. W dalszej części elementy należące do V nazywane będą często wektorami, a elementy ciała K będą zwane nieraz skalarami.

Kombinacją liniową wektorów \mathbf{v_1, v_2, \dots, v_n} o współczynnikach a_1, a_2, \dots a_n nazywa się wektor

a_1\mathbf{v_1} + a_2\mathbf{v_2} + \dots + a_n\mathbf{v_n}.

Uwaga[edytuj | edytuj kod]

Z definicji wynika, że pojęcie kombinacji liniowej ma skończony charakter, tzn. kombinacja liniowa zawiera tylko skończenie wiele wektorów (poza przypadkami opisanymi w sekcji Uogólnienia).

Jednakże sam zbiór S, z którego brane są wektory (o ile został wspomniany), może być nieskończony; każda kombinacja liniowa z osobna składać się będzie ze skończenie wielu wektorów. Nie ma także powodów, aby n nie mogło być zerem; w tym wypadku przyjmuje się, że wtedy kombinacją liniową jest wektor zerowy w V.

Przykłady[edytuj | edytuj kod]

Wektory[edytuj | edytuj kod]

Information icon.svg Zobacz też: wektor.

Niech K będzie ciałem \mathbb R liczb rzeczywistych, a przestrzeń liniowa V będzie przestrzenią euklidesową \mathbb R^3. Rozpatrzmy wektory

\mathbf{e_1} := (1, 0, 0),\; \mathbf{e_2} := (0, 1, 0) oraz \mathbf{e_3} := (0, 0, 1).

Wówczas dowolny wektor z \mathbb R^3 jest kombinacją liniową wektorów \mathbf{e_1, e_2, e_3}.

Aby się o tym przekonać, należy wziąć dowolny wektor (a_1, a_2, a_3) z \mathbb R^3; wtedy:

\begin{align} (a_1 , a_2 , a_3) & = (a_1, 0, 0) + (0, a_2, 0) + (0, 0, a_3) \\ & =  a_1 (1, 0, 0) + a_2 (0, 1, 0) + a_3 (0, 0, 1) \\ & = a_1 \mathbf{e_1} +  a_2 \mathbf{e_2} + a_3 \mathbf{e_3} \end{align}

Funkcje[edytuj | edytuj kod]

Information icon.svg Zobacz też: funkcjaprzestrzeń funkcyjna.

Niech V będzie przestrzenią rzeczywistych funkcji ciągłych o wartościach zespolonych C(\mathbb R, \mathbb C).

Rozważmy wektory (funkcje) f, g określone wzorami

f(t) := e^{it}, \quad g(t) := e^{-it},

gdzie e jest postawą logarytmu naturalnego, a i to jednostka urojona.

Niektóre z kombinacji liniowych f oraz g:

\cosh t = \tfrac12 e^{it} + \tfrac12 e^{-it},
2\sin t = -ie^{it} + ie^{-it}.

Z drugiej strony funkcja stała równa 3 nie jest kombinacją liniową f i g. Aby się o tym przekonać, należy założyć, że 3 może być zapisane jako kombinacja liniowa e^{it} oraz e^{-it}. Oznacza to, że istniałyby wówczas skalary zespolone a, b takie, że

ae^{it} - be^{-it} = 3

dla wszystkich liczb rzeczywistych t. Podstawienia t = 0 i t = \pi dają jednak równania a + b = 3 oraz a + b = -3, co prowadzi do sprzeczności.

Wielomiany[edytuj | edytuj kod]

Niech K będzie dowolnym ciałem, a V będzie zbiorem P wszystkich wielomianów o współczynnikach z tego ciała. Rozważmy wektory (wielomiany)

p_1 := 1, \quad p_2 := x + 1, \quad p_3 := x^2 + x + 1.

Czy wielomian x^2 - 1 jest kombinacją liniową p_1, p_2, p_3? Rozpatrzmy dowolną kombinację liniową tych wektorów i sprawdźmy, kiedy równa się ona żądanemu wektorowi x^2 - 1.

Wybrawszy dowolnie współczynniki a_1, a_2, a_3 chcemy uzyskać

a_1 (1) + a_2 (x + 1) +  a_3 (x^2 + x + 1) =  x^2 - 1,

wymnożenie wielomianów daje równość

(a_1) + (a_2 x + a_2) + (a_3 x^2 + a_3 x + a_3) =  x^2 - 1,

zaś zgrupowanie wg potęg x daje tożsamość

a_3 x^2 + (a_2 + a_3) x + (a_1 + a_2 + a_3) = 1 x^2 + 0 x + (-1).

Dwa wielomiany są równe wtedy i tylko wtedy, gdy odpowiadające sobie w nich współczynniki są sobie równe, a więc

a_3 = 1, \quad a_2 + a_3 = 0, \quad a_1 + a_2 + a_3 = -1.

Jedynym rozwiązaniem tego układu równań liniowych jest trójka

a_1 = -1, \quad a_2 = -1, \quad a_3 = 1.

Stąd jest to jedyny możliwy sposób uzyskania kombinacji liniowej za pomocą tych współczynników. Rzeczywiście,

x^2 - 1 = -1 - (x + 1) + (x^2 + x + 1) = - p_1 - p_2 + p_3,

a więc x^2 - 1 jest kombinacją liniową wektorów p_1, p_2, p_3.

Co zaś z wielomianem x^3 - 1? Chcąc uzyskać ten wektor jako kombinację liniową p_1, p_2, p_3 należy powtórzyć powyższe rozumowanie otrzymując tym samym równanie

0 x^3 + a_3 x^2 + (a_2 + a_3) x + (a_1 + a_2 + a_3) = 1 x^3 + 0 x^2 + 0 x + (-1).

W tym przypadku przyrównanie odpowiadających sobie współczynników da zawsze fałszywą równość

0 = 1.

Stąd nie można przedstawić x^3 - 1 jako kombinacji liniowej wektorów p_1, p_2, p_3.

Powłoka liniowa[edytuj | edytuj kod]

Dla danego ciała K oraz przestrzeni liniowej V niech \mathbf{v_1, v_2, \dots, v_n} będą wektorami (z V). Interesujące może być rozpatrywanie wszystkich kombinacji liniowych tych wektorów. Zbiór ten nazywa się powłoką liniową lub otoczką liniową tych wektorów. Niech S = \{\mathbf{v_1, v_2, \dots, v_n}\}, wówczas powłokę liniową S oznacza się \operatorname{span}(S) lub \operatorname{lin}(S):

\operatorname{span}(\mathbf{v_1, \dots, v_n}) := \{a_1\mathbf{v_1} + \dots + a_n\mathbf{v_n}\colon a_1, \dots, a_n \in K \}.

Wyżej opisany zbiór jest najmniejszą (w sensie zawierania) podprzestrzenią liniową w V. Z tego powodu nazywa się ją także podprzestrzenią generowaną przez zbiór S lub rozpiętą na zbiorze S. Sam zbiór S nazywa się też niekiedy zbiorem rozpinającym lub generującym tę przestrzeń.

Liniowa niezależność[edytuj | edytuj kod]

 Osobny artykuł: liniowa niezależność.

Dla ustalonego zbioru wektorów \mathbf{v_1, v_2, \dots, v_n} dany wektor można czasem zapisać na co najmniej dwa różne sposoby jako ich kombinację liniową

\mathbf v = \sum a_i \mathbf v_i = \sum b_i \mathbf v_i, \mbox{ gdzie } (a_i) \neq (b_i).

Równoważnie odejmując współczynniki, c_i := a_i - b_i, uzyskuje się nietrywialną kombinację o sumie zerowej:

\mathbf 0 = \sum c_i \mathbf v_i.

Mówi się wtedy, że wektory \mathbf{v_1, v_2, \dots, v_n}liniowo zależne, w przeciwnym wypadku nazywa się je liniowo niezależnymi. Podobnie można mówić o liniowej zależności bądź niezależności dowolnego zbioru wektorów S.

Jeżeli S jest układem wektorów liniowo niezależnych i rozpina całą przestrzeń V, to nazywa się go bazą tej przestrzeni.

Kombinacje afiniczne, stożkowe i wypukłe[edytuj | edytuj kod]

Można zdefiniować inne powiązane z kombinacją liniową pojęcia poprzez narzucenie ograniczeń na współczynniki kombinacji liniowej: kombinację afiniczną, kombinację stożkową, kombinację wypukłą i związane z nimi pojęcia zbiorów zamkniętych ze względu na te operacje.

Rodzaj kombinacji Ograniczenia na współczynniki Nazwa zbioru Model przestrzeni
Kombinacja liniowa brak podprzestrzeń liniowa \mathbb R^n
Kombinacja afiniczna \sum a_i = 1 podprzestrzeń afiniczna hiperpłaszczyzna afiniczna
Kombinacja stożkowa a_i \geqslant 0 stożek wypukły ćwiartka/oktant
Kombinacja wypukła a_i \geqslant 0 oraz \sum a_i = 1 zbiór wypukły sympleks

Ponieważ powyższe są działaniami bardziej ograniczającymi, to dawać będą one więcej zbiorów zamkniętych ze względu na nie, stąd podzbiory afiniczne, stożki wypukłe i zbiory wypukłe są uogólnieniami podprzestrzeni liniowych: podprzestrzeń liniowa jest zarazem podprzestrzenią afiniczną, stożkiem afinicznym i zbiorem wypukłym, ale zbiór wypukły nie musi być podprzestrzenią liniową, afiniczną lub stożkiem wypukłym.

Pojęcia te pojawiają się często, jeżeli możliwe jest wybranie określonej, lecz nie dowolnej, kombinacji liniowej obiektów: przykładowo rozkłady prawdopodobieństwa są zamknięte ze względu na kombinacje wypukłe (tworzą zbiór wypukły), ale nie są ze względu na kombinacje stożkowe, czy afiniczne (czy liniowe), a miary dodatnie są zamknięte ze względu na kombinacje stożkowe, ale nie kombinacje afiniczne, czy liniowe – stąd miary ze znakiem definiuje się jako liniowe domknięcie.

Kombinacje liniowe i afiniczne mogą być zdefiniowane nad dowolnym ciałem (czy pierścieniem), ale kombinacje stożkowe i wypukłe wymagają pojęcia „dodatniości” i dlatego mogą być zdefiniowane tylko nad ciałem uporządkowanym (lub pierścieniem uporządkowanym), zwykle nad liczbami rzeczywistymi.

Jeżeli dopuści się wyłącznie mnożenie przez skalar, lecz nie dodawanie wektorów, otrzymuje się (niekoniecznie wypukły) stożek; często zawęża się definicję poprzez ograniczenie do mnożenia przez skalary dodatnie.

Wszystkie te pojęcia są zwykle definiowane jako podzbiory danej przestrzeni liniowej (z wyjątkiem przestrzeni afinicznych, które uważa się za „przestrzenie liniowe bez początku”), a nie poprzez ich niezależną aksjomatyzację.

Teoria operadów[edytuj | edytuj kod]

W bardziej abstrakcyjnym języku teorii operadów można rozważać przestrzenie liniowe jako algebrę nad operadem \mathbb R^\infty (nieskończona suma prosta, w której tylko skończenie wiele wyrazów jest niezerowych; odpowiada to braniu wyłącznie sum skończonych), które parametryzują kombinacje liniowe: wektor (2, 3, -5, 0, \dots) odpowiada na przykład kombinacji liniowej 2\mathbf v_1 + 3\mathbf v_2 - 5\mathbf v_3 + 0\mathbf v_4 + \cdots. W podobny sposób można rozpatrywać kombinacje afiniczne, stożkowe, czy sferyczne tak, by odpowiadały podoperadom, których odpowiednio suma współczynników wynosi jeden, wszystkie współczynniki są nieujemne oraz oba te ograniczenia na raz. Graficznie tworzą one nieskończoną hiperpłaszczyznę afiniczną, nieskończony hiperoktant i nieskończony sympleks. Formalizuje to, co rozumie się przez standardowe modele \mathbb R^n, czy sympleksów i takie obserwacje jak każda ograniczona wielokomórka wypukła jest obrazem sympleksu. Podoperady odpowiadają tu bardziej ograniczającym operacjom, a przez to ogólniejszym teoriom.

Z tego punktu widzenia o kombinacjach liniowych można myśleć jako o najogólniejszych możliwych operacjach na przestrzeni liniowej – stwierdzenie, iż przestrzeń liniowa jest algebrą nad operadem kombinacji liniowych jest dokładnie tym samym, co stwierdzenie, że kombinacje liniowe obejmują wszystkie możliwe operacje na przestrzeni liniowej.

Podstawowe operacje dodawania i mnożenia przez skalar, wraz z istnieniem elementu neutralnego i odwrotnych dodawania, nie mogą być połączone w bardziej skomplikowany sposób niż w zwykłej kombinacji liniowej: wspomniane podstawowe operacje są zbiorem generującym operadów wszystkich kombinacji liniowych.

Ostatecznie fakt ten tłumaczy użyteczność kombinacji liniowych podczas studiowania przestrzeni liniowych.

Uogólnienia[edytuj | edytuj kod]

Jeżeli V jest przestrzenią liniowo-topologiczną, to być może istnieje sposób na sensowne określenie nieskończonych kombinacji liniowych za pomocą topologii w V. Przykładowo, być może można mówić o sumie

a_1 \mathbf{v_1} + a_2 \mathbf{v_2} + a_3 \mathbf{v_3} + \dots

ciągnącej się w nieskończoność. Nie zawsze takie nieskończone kombinacje liniowe mają sens; jednakże jeżeli tak jest, to nazywa się je zbieżnymi. Rozpatrywanie większej liczby kombinacji liniowych może prowadzić w tym przypadku do różnych definicji powłoki liniowej, liniowej niezależności i bazy. Artykuły opisujące przestrzenie liniowo-topologiczne traktują o nich bardziej szczegółowo.

Jeżeli K jest pierścieniem przemiennym, nie zaś ciałem, to wszystko, co zostało napisane wyżej, uogólnia się do tego przypadku bez żadnych zmian. Jedyną różnicą jest, iż przestrzenie V nazywa się wtedy modułami, a nie przestrzeniami liniowymi. Każdą grupę abelową można w naturalny sposób rozpatrywać jako moduł nad pierścieniem liczb całkowitych; prowadzi to do pojęć takich jak (liniowa) niezależność oraz ranga rozpatrywanych w tych grupach.

Jeżeli K jest pierścieniem nieprzemiennym, to pojęcie to nadal uogólnia się w analogiczny sposób z jednym zastrzeżeniem: moduły nad pierścieniami nieprzemiennymi mogą być lewostronne bądź prawostronne, zatem istnieją tak lewo- jak i prawostronne kombinacje liniowe – zależnie od rozpatrywanego modułu – należy zatem zwracać uwagę na branie mnożenia skalarnego z właściwej strony.

Bardziej złożony jest przypadek, gdy V jest bimodułem nad dwoma pierścieniami K_L oraz K_P. W tym wypadku najogólniejsza kombinacja liniowa ma postać

a_1 \mathbf{v_1} b_1 + \dots +  a_n \mathbf{v_n} b_n,

gdzie a_1, \dots, a_n należą do K_L, a b_1, \dots, b_n należą do K_P, zaś \mathbf{v_1, \dots, v_n} należą do V.