Liniowa niezależność

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Liniowa niezależność – w algebrze liniowej własność algebraiczna rodziny wektorów danej przestrzeni liniowej mówiąca, że żaden z nich nie może być zapisany jako kombinacja liniowa skończenie wielu innych wektorów ze zbioru. Rodzinę wektorów, która nie jest liniowo niezależna, nazywa się liniowo zależną.

Motywacja[edytuj | edytuj kod]

Własnością algebraiczną, bądź niezmiennikiem, przestrzeni liniowych nazywa się dowolną własność zachowywaną przez izomorfizmy tych przestrzeni. Są nimi m.in. bycie podzbiorem liniowo zależnym/niezależnym, kombinacją liniową, podprzestrzenią liniową, bazą oraz wymiar przestrzeni.

Wszystkie własności algebraiczne niezerowych wektorów przestrzeni liniowej skończonego wymiaru są identyczne, jednak nie jest to prawdą dla dowolnych dwóch równolicznych układów wektorów. Okazuje się jednak, że własności algebraiczne dowolnych dwóch skończonych zbiorów liniowo niezależnych składających się z tej samej liczby wektorów należących do danej przestrzeni są identyczne; nie można jednak powiedzieć tego samego o zbiorach liniowo zależnych (mogą one np. rozpinać podprzestrzenie innego wymiaru).

Przykładowo w trójwymiarowej przestrzeni liniowej \mathbb R^3 nad ciałem liczb rzeczywistych zachodzi:

\begin{matrix} \mathrm{niezale\dot zne} \qquad \\ \underbrace{\overbrace{\begin{bmatrix} 0 \\ 0 \\ 1 \end{bmatrix}, \begin{bmatrix} 0 \\ 2 \\ -2 \end{bmatrix}, \begin{bmatrix} 1 \\ -2 \\ 1 \end{bmatrix}}, \begin{bmatrix} 4 \\ 2 \\ 3 \end{bmatrix}} \\ \mathrm{zale\dot zne} \\ \end{matrix}

Wyżej pierwsze trzy wektory są liniowo niezależne, ale czwarty wektor równy jest 9-krotności pierwszego powiększonego o 5-krotność drugiego i 4-krotność trzeciego, tak więc powyższe cztery wektory są razem liniowo zależne. Liniowa zależność jest własnością danej rodziny, a nie jakiegokolwiek wektora z osobna; w powyższym przykładzie można by przedstawić pierwszy wektor jako kombinację liniową ostatnich trzech:

\mathbf v_1 = \left(-\tfrac{5}{9}\right) \mathbf v_2 + \left(-\tfrac{4}{9}\right) \mathbf v_3 + \tfrac{1}{9} \mathbf v_4.

W ten sposób rodzinie złożonej z powyższych trzech pierwszych wektorów przysługują te same własności algebraiczne, co innej liniowo niezależnej rodzinie wektorów tej przestrzeni złożonej z trzech elementów, np.

\begin{bmatrix} 1 \\ 0 \\ -1 \end{bmatrix}, \begin{bmatrix} 0 \\ 3 \\ 0 \end{bmatrix}, \begin{bmatrix} 0 \\ 0 \\ -2 \end{bmatrix}.

Definicja[edytuj | edytuj kod]

Podzbiór S przestrzeni liniowej V nazywa się liniowo zależnym, jeżeli istnieje skończona liczba różnych wektorów \mathbf v_1, \mathbf v_2, \dots, \mathbf v_n ze zbioru S oraz skalary a_1, a_2, \dots, a_n, nie wszystkie zerowe, takie że

a_1 \mathbf v_1 + a_2 \mathbf v_2 + \dots + a_n \mathbf v_n = \mathbf 0.

Zero po prawej stronie oznacza wektor zerowy, a nie liczbę zero.

Jeżeli takie skalary nie istnieją, to powyższe wektory nazywa się liniowo niezależnymi. Warunek ten można także wyrazić następująco: jeżeli a_1, a_2, \dots, a_n, są skalarami takimi, że

a_1 \mathbf v_1 + a_2 \mathbf v_2 + \dots + a_n \mathbf v_n = \mathbf 0,

to jest a_i = 0 dla i = 1, 2, \dots, n, tzn. istnieje tylko rozwiązanie trywialne.

Zbiór jest liniowo niezależny wtedy i tylko wtedy, gdy jedynymi reprezentacjami wektora zerowego jako kombinacji liniowej elementów tego zbioru są rozwiązania trywialne.

Ogólniej, niech V oznacza przestrzeń liniową nad ciałem K, a \{\mathbf v_i\colon i \in I\} będzie rodziną elementów V. Rodzina jest liniowo zależna nad K, jeżeli istnieje rodzina \{a_j\colon j \in J\} elementów K, nie wszystkich zerowych, taka że

\sum_{j \in J} a_j \mathbf v_j = \mathbf 0,

gdzie zbiór indeksów J jest niepustym, skończonym podzbiorem I.

Zbiór X elementów V jest liniowo niezależny, jeżeli odpowiadająca mu rodzina \{\mathbf x\}_{\mathbf x \in X} jest liniowo niezależna.

Równoważnie rodzina jest zależna, jeżeli jej element należy do powłoki liniowej reszty rodziny, tzn. element jest kombinacją liniową pozostałej części rodziny.

Interpretacja geometryczna[edytuj | edytuj kod]

Wyjaśnieniu pojęcia liniowej niezależności może przysłużyć się przykład geograficzny. Osoba opisująca położenie pewnego miejsca może stwierdzić: „znajduje się ono 5 km na północ i 6 km na wschód stąd”. Informacja ta wystarczy do opisania położenia, ponieważ układ współrzędnych geograficznych może być postrzegany jako dwuwymiarowa przestrzeń liniowa (ignorując wzniesienie). Osoba ta może dodać: „miejsce leży 7,81 km na północny wschód stąd”. Choć jest to stwierdzenie prawdziwe, to nie jest ono niezbędne.

W powyższym przykładzie wektory „5 km na północ” oraz „6 km na wschód” są liniowo niezależne. Oznacza to, że wektor północny nie może być opisany za pomocą wektora wschodniego i na odwrót. Trzeci wektor „7,81 km na północny wschód” jest kombinacją liniową pozostałych dwóch, co czyni ten zbiór wektorów liniowo zależnym, tzn. jeden z tych trzech wektorów jest zbędny.

Jeżeli nie zaniedbywać wzniesienia, to niezbędne staje się dodanie trzeciego wektora do zbioru liniowo niezależnego. W ogólności potrzeba n liniowo niezależnych wektorów do opisania dowolnego położenia w n-wymiarowej przestrzeni.

Korzystając z równoważnego sformułowania liniowej niezależności można powiedzieć, że po wykonaniu (istotnego, niezerowego) ruchu z początku (przestrzeni) opisanego przy pomocy wektorów liniowo niezależnych (poprzez co najwyżej jednokrotne złożenie, czyli dodanie, każdego z nich) powrót do niego jest niemożliwy – osiągnięcie go wymaga braku ruchu w jakimkolwiek kierunku, co oznacza, że cały ruch może być opisany wyłącznie przez wektor zerowy.

Własności[edytuj | edytuj kod]

Układ zawierający wektor zerowy bądź zawierający dany wektor dwukrotnie jest liniowo zależny.

Dowolny podukład \mathbf v_{i_1}, \dots, \mathbf v_{i_k} liniowo niezależnego układu wektorów \mathbf v_1, \dots, \mathbf v_n jest liniowo niezależny.

Układ \mathbf w_1, \dots, \mathbf w_n powstały z układu \mathbf v_1, \dots, \mathbf v_n poprzez skończoną liczbę operacji elementarnych, tzn.

jest liniowo niezależny wtedy i tylko wtedy, gdy liniowo niezależny był układ \mathbf v_1, \dots, \mathbf v_n.

Zbiór wektorów, który jest liniowo niezależny i rozpina pewną przestrzeń liniową, stanowi bazę tej przestrzeni. Przykładowo przestrzeń liniowa wszystkich wielomianów zmiennej x nad ciałem liczb rzeczywistych ma (nieskończoną) bazę \{1, x, x^2, \dots\}.

Przykłady[edytuj | edytuj kod]

Przykład I[edytuj | edytuj kod]

Wektory (1, 1) i (-3, 2) z \mathbb R^2 są liniowo niezależne.

Dowód
Niech \lambda_1 oraz \lambda_2 będą dwiema liczbami rzeczywistymi takimi, że
(1, 1) \lambda_1 + (-3, 2) \lambda_2 = (0, 0).
Biorąc każdą współrzędną z osobna oznacza to, iż
\begin{align} \lambda_1 - 3 \lambda_2 & = 0, \\ \lambda_1 + 2 \lambda_2 & = 0. \end{align}
Rozwiązując to równanie względem \lambda_1 i \lambda_2 uzyskuje się \lambda_1 = 0 oraz \lambda_2 = 0.
Alternatywna metoda wyznacznikowa
Metoda alternatywna wykorzystuje fakt, że n wektorów w \mathbb R^n jest liniowo zależnych wtedy i tylko wtedy, gdy wyznacznik macierzy, której kolumnami są dane wektory wynosi zero.
W tym przypadku macierz utworzona z tych wektorów ma postać
\mathbf A = \begin{bmatrix} 1 & -3 \\ 1 & 2 \end{bmatrix}.
Kombinację liniową kolumn można zapisać jako
\mathbf A \boldsymbol \Lambda = \begin{bmatrix} 1 & -3 \\ 1 & 2 \end{bmatrix} \begin{bmatrix}\lambda_1 \\ \lambda_2 \end{bmatrix}.
Interesujące jest, czy \mathbf A \boldsymbol \Lambda = \mathbf 0 dla pewnego niezerowego wektora \boldsymbol \Lambda. Zależy to od wyznacznika \mathbf A, który jest równy
\det \mathbf A = 1 \cdot 2 - 1 \cdot (-3) = 5 \ne 0.
Ponieważ wyznacznik jest różny od zera, wektory (1, 1) i (-3, 2) są liniowo niezależne.
Jeżeli liczba wektorów jest równa wymiarowi wektorów, macierz jest kwadratowa i stąd wyznacznik jest dobrze określony.
W przeciwnym przypadku można założyć, że danych jest m wektorów o n współrzędnych, gdzie m \leqslant n. Wtedy \mathrm A jest macierzą typu n \times m, a \boldsymbol \Lambda jest wektorem kolumnowym o m elementach. Znowu interesująca jest równość \mathbf A \boldsymbol \Lambda = \mathbf 0. Jak pokazano wcześniej jest to równoważne układowi n równań. Rozważmy m pierwszych rzędów \mathbf A, pierwszych m równań; dowolne rozwiązanie pełnego układu równań musi być także prawdziwe dla układu zredukowanego. Rzeczywiście, jeżeli \langle i_1, \dots, i_m \rangle jest dowolnym układem m rzędów, to równania muszą być spełnione dla tych rzędów.
\mathbf A_{\langle i_1, \dots, i_m \rangle} \boldsymbol \Lambda = \mathbf 0.
Co więcej prawdziwe jest twierdzenie odwrotne, tzn. możliwe jest sprawdzenie, czy m wektorów jest liniowo zależnych poprzez sprawdzenie, czy
\det \mathbf A_{\langle i_1, \dots, i_m \rangle} = 0
dla wszystkich możliwych układów m rzędów (w przypadku m = n wymaga to, jak wyżej, sprawdzenia tylko jednego wyznacznika; jeżeli m \geqslant n, to jest to twierdzenie o tym, że wektory muszą być liniowo zależne). Fakt ten jest wartościowy w teorii – w obliczeniach praktycznych dostępne są bardziej efektywne metody.

Przykład II[edytuj | edytuj kod]

Niech V = \mathbb R^n i niech dane będą następujące elementy z V:

\begin{matrix} \mathbf e_1 & = & (1, 0, 0, \dots, 0) \\ \mathbf e_2 & = & (0, 1, 0, \dots, 0) \\ & \vdots \\ \mathbf e_n & = & (0, 0, 0, \dots, 1).\end{matrix}

Wtedy \mathbf e_1, \mathbf e_2, \dots, \mathbf e_n są liniowo niezależne.

Dowód
Niech a_1, a_2, \dots, a_n będą takimi elementami \mathbb R, że
 a_1 \mathbf e_1 + a_2 \mathbf e_2 + \dots + a_n \mathbf e_n = \mathbf 0.
Ponieważ
a_1 \mathbf e_1 + a_2 \mathbf e_2 + \dots + a_n \mathbf e_n = (a_1, a_2, \dots, a_n),
to a_i = 0 dla każdego i \in \{1, \dots, n\}.

Przykład III[edytuj | edytuj kod]

Niech V będzie przestrzenią liniową wszystkich funkcji zmiennej t. Funkcje e^t i e^{2t} należące do V są liniowo niezależne.

Dowód
Niech a i b będą takimi dwiema liczbami rzeczywistymi, że
ae^t + be^{2t} = 0
dla wszystkich wartości t. Należy wykazać, że a = 0 oraz b = 0. Aby to wykazać, należy podzielić to równanie przez e^t (które nigdy nie przyjmuje zera) i przenieść pozostały wyraz na drugą stronę, co daje
be^t = -a.
Innymi słowy funkcja be^t musi być niezależna od t, co zachodzi tylko, gdy b = 0. Wynika stąd, że również a jest równe zeru.

Przykład IV[edytuj | edytuj kod]

Następujące wektory przestrzeni \mathbb R^4 są liniowo zależne:

\begin{matrix} \begin{bmatrix} 1 \\ 4 \\ 2 \\ -3 \end{bmatrix}, \begin{bmatrix} 7 \\ 10 \\ -4 \\ -1 \end{bmatrix} \mbox{ oraz } \begin{bmatrix} -2 \\ 1 \\ 5 \\ -4 \end{bmatrix} \end{matrix}
Dowód
Należy znaleźć takie skalary \lambda_1,\; \lambda_2,\; \lambda_3, że
\begin{matrix} \lambda_1 \begin{bmatrix} 1 \\ 4 \\ 2 \\ -3 \end{bmatrix} + \lambda_2 \begin{bmatrix} 7 \\ 10 \\ -4 \\ -1 \end{bmatrix} + \lambda_3 \begin{bmatrix} -2 \\ 1 \\ 5 \\ -4 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \\ 0 \\ 0 \end{bmatrix}.\end{matrix}
Rozwiązując układ równań
\begin{align} \lambda_1 & \;+ 7\lambda_2 & & - 2\lambda_3 & = 0 \\ 4 \lambda_1 & \;+ 10\lambda_2 & & + \lambda_3 & = 0 \\ 2\lambda_1 & \;- 4\lambda_2 & & + 5\lambda_3 & = 0 \\ -3\lambda_1 & \;- \lambda_2 & & - 4\lambda_3 & = 0 \end{align}
(np. za pomocą eliminacji Gaussa) uzyskuje się
\begin{align} \lambda_1 & = -\tfrac{3}{2} \lambda_3 \\ \lambda_2 & = \tfrac{1}{2} \lambda_3, \end{align}
gdzie \lambda_3 może być dowolną liczbą.
Ponieważ są to wyniki nietrywialne, wektory są liniowo zależne.

Przestrzeń rzutowa zależności liniowych[edytuj | edytuj kod]

Liniowa zależność między wektorami \mathbf v_1, \dots, \mathbf v_n to n-tka (a_1, \dots, a_n) o składowych skalarnych, nie wszystkich zerowych, takich że

a_1 \mathbf v_1 + \dots + a_n \mathbf v_n = \mathbf 0.

Jeżeli taka liniowa zależność istnieje, to powyższe n wektorów jest liniowo zależnych. Utożsamianie dwóch zależności liniowych ma sens, jeżeli jedna z nich powstaje jako niezerowa wielokrotność drugiej, ponieważ wtedy obie opisują tę samą zależność liniową między wektorami. Utożsamienie to czyni ze zbioru wszystkich zależności liniowych między \mathbf v_1, \dots, \mathbf v_n przestrzeń rzutową.

Grupy abelowe i moduły[edytuj | edytuj kod]

Pojęcie liniowej niezależności można wprowadzić również w grupach abelowych (notacja addytywna) – należy jedynie zwrócić uwagę na ograniczoną możliwość skalowania wektorów: układ \{\mathsf a_1, \dots, \mathsf a_k\} niezerowych elementów grupy abelowej A nazywa się (liniowo) niezależnym, jeżeli

n_1 \mathsf a_1 + \dots + n_k \mathsf a_k = \mathsf 0

pociąga

n_1 \mathsf a_1 = \dots = n_k \mathsf a_k = \mathsf 0,

gdzie n_i \in \mathbb Z.

Powyższy warunek jest równoważny temu, iż n_i = 0, o ile rząd \operatorname o(\mathsf a_i) = \infty oraz \operatorname o(\mathsf a_i)|n_i, jeżeli \mathrm o(\mathsf a_i) < \infty. W przeciwieństwie do przestrzeni liniowych w ogólności nie jest prawdą, że elementy układu zależnego można zapisać jako kombinację liniową pozostałych: jeśli układ jest zależny, to z równości

n_1 \mathsf a_1 + \dots + n_k \mathsf a_k = \mathsf 0

wynika jedynie, iż co najmniej jeden z wyrazów tej kombinacji, np. n_1 \mathsf a_1, jest różny od \mathsf 0, tzn. prawdziwa jest tylko zależność

n_1 \mathsf a_1 = -n_2 \mathsf a_2 - \dots - n_k \mathsf a_k.

Układ L = \{\mathsf a_i\}_{i \in I} jest niezależny wtedy i tylko wtedy, gdy podgrupa generowana przez L jest sumą prostą grup cyklicznych \langle \mathsf a_i \rangle_{i \in I}.

O elemencie \mathsf g \in A mówi sie, iż jest zależny od podzbioru L zbioru A, jeżeli dla pewnych \mathsf a_i \in L oraz liczb całkowitych n, n_i zachodzi relacja zależności

\mathsf 0 \ne n\mathsf g = n_1 \mathsf \mathsf a_1 + \dots + n_k \mathsf a_k.

Podzbiór K zbioru A jest zależny od L, jeżeli każdy element \mathsf g \in K jest zależny od L. Jeżeli K jest zależny od L, a L jest zależny od K, to o K i L mówi się, że są równoważne.

Układ niezależny M elementów grupy A jest maksymalny, jeżeli nie istnieje układ niezależny elementów A zawierający M w sposób właściwy. Dowolne dwa maksymalne układy niezależne w grupie A są równoważne. Dowodzi się, że układ niezależny M elementów z A jest maksymalny wtedy i tylko wtedy, gdy \langle M \rangle jest podgrupą istotną w A, tzn. ma ona nietrywialne przecięcie z dowolną niezerową podgrupą (cykliczną) grupy A. Każdy maksymalny układ niezależny w podgrupie istotnej grupy A jest maksymalnym układem niezależnym w A.

Okazuje się, że moc wszystkich maksymalnych układów niezależnych grupy jest równa i zależy wyłącznie od A. Wielkość tę nazywa się rangą danej grupy abelowej. Pojęcie rangi o analogicznych własnościach można zdefiniować dla modułów nad dowolną dziedziną całkowitości, przy czym przypadek grup abelowych odpowiada modułom nad pierścieniem liczb całkowitych.

Liniowa zależność zmiennych losowych[edytuj | edytuj kod]

Czasami kowariancję nazywa się miarą „zależności liniowej” między dwoma zmiennymi losowymi. Nie jest to to samo pojęcie, co przedstawione wyżej. Znormalizowanie kowariancji daje macierz korelacji, z niej zaś uzyskuje się współczynnik Pearsona, który oddaje wierność dopasowania do najlepszej możliwej funkcji liniowej opisującej relację między tymi zmiennymi. W tym sensie kowariancja jest liniowym wskaźnikiem zależności.

Zobacz też[edytuj | edytuj kod]

Linki zewnętrzne[edytuj | edytuj kod]