Liniowa niezależność

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Liniowa niezależność – własność algebraiczna rodziny wektorów danej przestrzeni liniowej mówiąca, że żaden z nich nie może być zapisany jako kombinacja liniowa skończenie wielu innych wektorów ze zbioru. Rodzinę wektorów, która nie jest liniowo niezależna, nazywa się liniowo zależną.

Motywacja[edytuj]

Własnością algebraiczną, bądź niezmiennikiem, przestrzeni liniowych nazywa się dowolną własność zachowywaną przez izomorfizmy tych przestrzeni. Są nimi m.in. bycie podzbiorem liniowo zależnym/niezależnym, kombinacją liniową, podprzestrzenią liniową, bazą oraz wymiar przestrzeni.

Wszystkie własności algebraiczne niezerowych wektorów przestrzeni liniowej skończonego wymiaru są identyczne, jednak nie jest to prawdą dla dowolnych dwóch równolicznych układów wektorów. Okazuje się jednak, że własności algebraiczne dowolnych dwóch skończonych zbiorów liniowo niezależnych składających się z tej samej liczby wektorów należących do danej przestrzeni są identyczne; nie można jednak powiedzieć tego samego o zbiorach liniowo zależnych (mogą one np. rozpinać podprzestrzenie innego wymiaru).

Przykładowo w trójwymiarowej przestrzeni liniowej \mathbb R^3 nad ciałem liczb rzeczywistych zachodzi:

\begin{matrix} \mathrm{niezale\dot zne} \qquad \\ \underbrace{\overbrace{\begin{bmatrix} 0 \\ 0 \\ 1 \end{bmatrix}, \begin{bmatrix} 0 \\ 2 \\ -2 \end{bmatrix}, \begin{bmatrix} 1 \\ -2 \\ 1 \end{bmatrix}}, \begin{bmatrix} 4 \\ 2 \\ 3 \end{bmatrix}} \\ \mathrm{zale\dot zne} \\ \end{matrix}

Wyżej pierwsze trzy wektory są liniowo niezależne, ale czwarty wektor równy jest 9-krotności pierwszego powiększonego o 5-krotność drugiego i 4-krotność trzeciego, tak więc powyższe cztery wektory są razem liniowo zależne. Liniowa zależność jest własnością danej rodziny, a nie jakiegokolwiek wektora z osobna; w powyższym przykładzie można by przedstawić pierwszy wektor jako kombinację liniową ostatnich trzech:

\mathbf v_1 = \left(-\tfrac{5}{9}\right) \mathbf v_2 + \left(-\tfrac{4}{9}\right) \mathbf v_3 + \tfrac{1}{9} \mathbf v_4.

W ten sposób rodzinie złożonej z powyższych trzech pierwszych wektorów przysługują te same własności algebraiczne, co innej liniowo niezależnej rodzinie wektorów tej przestrzeni złożonej z trzech elementów, np.

\begin{bmatrix} 1 \\ 0 \\ -1 \end{bmatrix}, \begin{bmatrix} 0 \\ 3 \\ 0 \end{bmatrix}, \begin{bmatrix} 0 \\ 0 \\ -2 \end{bmatrix}.

Definicja[edytuj]

Podzbiór S przestrzeni liniowej V nazywa się liniowo zależnym, jeżeli istnieje skończona liczba różnych wektorów \mathbf v_1, \mathbf v_2, \dots, \mathbf v_n ze zbioru S oraz skalary a_1, a_2, \dots, a_n, nie wszystkie zerowe, takie że

a_1 \mathbf v_1 + a_2 \mathbf v_2 + \dots + a_n \mathbf v_n = \mathbf 0.

Zero po prawej stronie oznacza wektor zerowy, a nie liczbę zero.

Jeżeli dla żadnego skończonego układu różnych wektorów \mathbf v_1, \mathbf v_2, \dots, \mathbf v_n\in S takie skalary nie istnieją, to podzbiór S nazywa się liniowo niezależnym.

Warunek na liniową zależność można także wyrazić następująco: jeżeli a_1, a_2, \dots, a_n, są skalarami takimi, że

a_1 \mathbf v_1 + a_2 \mathbf v_2 + \dots + a_n \mathbf v_n = \mathbf 0,

to a_i = 0 dla i = 1, 2, \dots, n, tzn. istnieje tylko rozwiązanie trywialne.

Zbiór jest liniowo niezależny wtedy i tylko wtedy, gdy jedynymi reprezentacjami wektora zerowego jako kombinacji liniowej elementów tego zbioru są rozwiązania trywialne.

Równoważnie, zbiór jest zależny, jeżeli pewien jego element należy do powłoki liniowej reszty zbioru, tzn. pewien jego element jest kombinacją liniową pozostałej części rodziny.


Ogólniej, niech V oznacza przestrzeń liniową nad ciałem K i niech \{\mathbf v_i\}_{ i \in I} będzie zbiorem indeksowanym elementów przestrzeni V. Zbiór jest liniowo zależny nad K, jeżeli dla pewnego niepustego, skończonego podzbioru J\subset I w zbiorze \{a_j\}_{j \in J} elementów K choć jeden element jest niezerowy i zachodzi

\sum_{j \in J} a_j \mathbf v_j = \mathbf 0,.

Zbiór X elementów V jest liniowo niezależny, jeżeli odpowiadający mu zbiór \{\mathbf x_i\}_{\mathbf i \in X} jest liniowo niezależny.

Interpretacja geometryczna[edytuj]

Wyjaśnieniu pojęcia liniowej niezależności może przysłużyć się przykład geograficzny. Osoba opisująca położenie pewnego miejsca może stwierdzić: „znajduje się ono 5 km na północ i 6 km na wschód stąd”. Informacja ta wystarczy do opisania położenia, ponieważ układ współrzędnych geograficznych może być postrzegany jako dwuwymiarowa przestrzeń liniowa (ignorując wzniesienie). Osoba ta może dodać: „miejsce leży 7,81 km na północny wschód stąd”. Choć jest to stwierdzenie prawdziwe, to nie jest ono niezbędne.

W powyższym przykładzie wektory „5 km na północ” oraz „6 km na wschód” są liniowo niezależne. Oznacza to, że wektor północny nie może być opisany za pomocą wektora wschodniego i na odwrót. Trzeci wektor „7,81 km na północny wschód” jest kombinacją liniową pozostałych dwóch, co czyni ten zbiór wektorów liniowo zależnym, tzn. jeden z tych trzech wektorów jest zbędny.

Jeżeli nie zaniedbywać wzniesienia, to niezbędne staje się dodanie trzeciego wektora do zbioru liniowo niezależnego. W ogólności potrzeba n liniowo niezależnych wektorów do opisania dowolnego położenia w n-wymiarowej przestrzeni.

Korzystając z równoważnego sformułowania liniowej niezależności można powiedzieć, że po wykonaniu (istotnego, niezerowego) ruchu z początku (przestrzeni) opisanego przy pomocy wektorów liniowo niezależnych (poprzez co najwyżej jednokrotne złożenie, czyli dodanie, każdego z nich) powrót do niego jest niemożliwy – osiągnięcie go wymaga braku ruchu w jakimkolwiek kierunku, co oznacza, że cały ruch może być opisany wyłącznie przez wektor zerowy.

Własności[edytuj]

Układ zawierający wektor zerowy bądź zawierający dany wektor dwukrotnie jest liniowo zależny.

Dowolny podukład \mathbf v_{i_1}, \dots, \mathbf v_{i_k} liniowo niezależnego układu wektorów \mathbf v_1, \dots, \mathbf v_n jest liniowo niezależny.

Układ \mathbf w_1, \dots, \mathbf w_n powstały z układu \mathbf v_1, \dots, \mathbf v_n poprzez skończoną liczbę operacji elementarnych, tzn.

jest liniowo niezależny wtedy i tylko wtedy, gdy liniowo niezależny był układ \mathbf v_1, \dots, \mathbf v_n.

Zbiór wektorów, który jest liniowo niezależny i rozpina pewną przestrzeń liniową, stanowi bazę tej przestrzeni.

Przykłady[edytuj]

Przykład I[edytuj]

Wektory (1, 1) i (-3, 2) z \mathbb R^2 są liniowo niezależne.

Dowód
Niech \lambda_1 oraz \lambda_2 będą dwiema liczbami rzeczywistymi takimi, że
(1, 1) \lambda_1 + (-3, 2) \lambda_2 = (0, 0).
Biorąc każdą współrzędną z osobna uzyskuje się układ równań z niewiadomymi \lambda_1, \lambda_2:
\begin{align} \lambda_1 - 3 \lambda_2 & = 0, \\ \lambda_1 + 2 \lambda_2 & = 0. \end{align}
Jego rozwiązaniem są \lambda_1 = 0 oraz \lambda_2 = 0.

Przykład II[edytuj]

Niech V = \mathbb R^n i niech dane będą następujące elementy z V:

\begin{matrix} \mathbf e_1 & = & (1, 0, 0, \dots, 0) \\ \mathbf e_2 & = & (0, 1, 0, \dots, 0) \\ & \vdots \\ \mathbf e_n & = & (0, 0, 0, \dots, 1).\end{matrix}

Wtedy \mathbf e_1, \mathbf e_2, \dots, \mathbf e_n są liniowo niezależne.

Dowód
Niech a_1, a_2, \dots, a_n będą takimi elementami \mathbb R, że
 a_1 \mathbf e_1 + a_2 \mathbf e_2 + \dots + a_n \mathbf e_n = \mathbf 0.
Ponieważ
a_1 \mathbf e_1 + a_2 \mathbf e_2 + \dots + a_n \mathbf e_n = (a_1, a_2, \dots, a_n),
to a_i = 0 dla każdego i \in \{1, \dots, n\}.

Przykład III[edytuj]

Niech V będzie przestrzenią liniową wszystkich funkcji zmiennej t. Funkcje e^t i e^{2t} należące do V są liniowo niezależne.

Dowód
Niech a i b będą takimi dwiema liczbami rzeczywistymi, że
ae^t + be^{2t} = 0
dla wszystkich wartości t. Należy wykazać, że a = 0 oraz b = 0. Aby to wykazać, należy podzielić to równanie przez e^t (które nigdy nie przyjmuje zera) i przenieść pozostały wyraz na drugą stronę, co daje
be^t = -a.
Innymi słowy funkcja be^t musi być niezależna od t, co zachodzi tylko, gdy b = 0. Wynika stąd, że również a jest równe zeru.

Przykład IV[edytuj]

Następujące wektory przestrzeni \mathbb R^4 są liniowo zależne:

\begin{matrix} \begin{bmatrix} 1 \\ 4 \\ 2 \\ -3 \end{bmatrix}, \begin{bmatrix} 7 \\ 10 \\ -4 \\ -1 \end{bmatrix} \mbox{ oraz } \begin{bmatrix} -2 \\ 1 \\ 5 \\ -4 \end{bmatrix} \end{matrix}
Dowód
Należy znaleźć takie skalary \lambda_1,\; \lambda_2,\; \lambda_3, że
\begin{matrix} \lambda_1 \begin{bmatrix} 1 \\ 4 \\ 2 \\ -3 \end{bmatrix} + \lambda_2 \begin{bmatrix} 7 \\ 10 \\ -4 \\ -1 \end{bmatrix} + \lambda_3 \begin{bmatrix} -2 \\ 1 \\ 5 \\ -4 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \\ 0 \\ 0 \end{bmatrix}.\end{matrix}
Rozwiązując układ równań
\begin{align} \lambda_1 & \;+ 7\lambda_2 & & - 2\lambda_3 & = 0 \\ 4 \lambda_1 & \;+ 10\lambda_2 & & + \lambda_3 & = 0 \\ 2\lambda_1 & \;- 4\lambda_2 & & + 5\lambda_3 & = 0 \\ -3\lambda_1 & \;- \lambda_2 & & - 4\lambda_3 & = 0 \end{align}
(np. za pomocą eliminacji Gaussa) uzyskuje się
\begin{align} \lambda_1 & = -\tfrac{3}{2} \lambda_3 \\ \lambda_2 & = \tfrac{1}{2} \lambda_3, \end{align}
gdzie \lambda_3 może być dowolną liczbą.
Ponieważ są to wyniki nietrywialne, wektory są liniowo zależne.

Przykład V[edytuj]

W przestrzeni liniowej wszystkich wielomianów zmiennej x nad ciałem liczb rzeczywistych zbiór wektorów

\{1, x, x^2, \dots\}

jest liniowo niezależny.

Dowód

Zgodnie z definicją, wystarczy wykazać, że dla dowolnego skończonego podukładu \{x^{p_1}, x^{p_2}, x^{p_3}, \dots\, x^{p_n}\} kombinacja

a_{p_1}\cdot x^{p_1}+a_{p_2}\cdot x^{p_2}+ a_{p_3}\cdot x^{p_3}+ \dots\ + a_{p_n}\cdot x^{p_n}

zeruje się tylko wtedy, gdy

a_{p_1}=a_{p_2}= a_{p_3}= \dots\ = a_{p_n}=0

Rzeczywiście, równość

a_{p_1}\cdot x^{p_1}+a_{p_2}\cdot x^{p_2}+ a_{p_3}\cdot x^{p_3}+ \dots\ + a_{p_n}\cdot x^{p_n}\ =\ 0

oznacza równość wielomianów tzn. równość odpowiednich współczynników.

Metoda wyznacznikowa badania liniowej niezależności[edytuj]

W przestrzeniach skończenie wymiarowych do badania, czy układy wektorów są liniowo zależne, czy niezależne, można wykorzystać pojęcie wyznacznika i rzędu macierzy.

Ponieważ wyznacznik macierzy n×n jest równy zero wtedy i tylko wtedy, gdy układ kolumn jest liniowo zależny, więc w przestrzeni n-wymiarowej \mathbb K^n układ n wektorów jest liniowo zależny wtedy i tylko wtedy, gdy wyznacznik macierzy, której kolumnami są współczynniki tych wektorów w dowolnej bazie, jest zerowy.

Np. dla wektorów (1, 1) i (-3, 2) z \mathbb R^2 odpowiednia macierz ma postać

\mathbf A = \begin{bmatrix} 1 & -3 \\ 1 & 2 \end{bmatrix}.

Ponieważ

\det \mathbf A = 1 \cdot 2 - 1 \cdot (-3) = 5 \ne 0,

więc wektory te są liniowo niezależne

Jeżeli w przestrzeni n-wymiarowej \mathbb K^n weźmiemy m wektorów, gdzie m > n, to układ taki jest liniowo zależny, bowiem rząd odpowiedniej macierzy nie przekracza n. Rząd zaś jest liczbą maksymalnie liniowo niezależnych wektorów, więc układ m wektorów jest liniowo zależny.

Np. dla wektorów (1, 1),\ (-3, 2),\ (3,3),\ (4,-1) z \mathbb R^2 odpowiednia macierz ma postać

\mathbf A = \begin{bmatrix} 1 & -3 & 3 & 4\\ 1 & 2 & 3 & -1\end{bmatrix}.

Układ jest oczywiście liniowo zależny, liniowo zależne są także wszystkie układy trzech wektorów.
Ponieważ rząd tej macierzy jest równy 2 i niezerującymi minorami stopnia są minory wszystkie z wyjątkiem minora zbudowanego na 1 i 3 kolumnie, więc wszystkie układy dwóch wektorów z wyjątkiem układu (1, 1),\  (3,3) są liniowo niezależne.

Jeśli w przestrzeni n-wymiarowej \mathbb K^n weźmiemy m wektorów, gdzie m < n, to - podobnie jak wyżej - rząd macierzy jest liczbą maksymalnie liniowo niezależnych wektorów. Wektory te ustalamy ustalając najpierw maksymalny niezerujący się minor tej macierzy. Jego stopień jest ilością liniowo niezależnych wektorów wśród wektorów badanych. Te liniowo niezależne wektory wybieramy z całego ukłądu sprawdzając, czy "przechodzą" przez wyznaczony minor.

Np. dla wektorów (1, 1, 0, 2),\ (2, 3, -1, 3),\ (0,1, -1, -1) z \mathbb R^4 odpowiednia macierz ma postać

\mathbf A = \begin{bmatrix} 1 & 2 & 0\\ 1 & 3 & 1\\ 0 & -1 & -1 \\ 2 & 3 & -1 \end{bmatrix}.

Układ jest oczywiście liniowo zależny bowiem rząd macierzy jest równy 2 tzn. każdy minor stopnia 3 jest zerowy. Każde dwa wektory spośród tych trzech tworzą układ liniowo niezależny, bowiem dowolne minory stopnia 2 zbudowane np. z dwóch pierwszych wierszy są niezerowe.

Przestrzeń rzutowa zależności liniowych[edytuj]

Liniowa zależność między wektorami \mathbf v_1, \dots, \mathbf v_n to n-tka (a_1, \dots, a_n) o składowych skalarnych, nie wszystkich zerowych, takich że

a_1 \mathbf v_1 + \dots + a_n \mathbf v_n = \mathbf 0.

Jeżeli taka liniowa zależność istnieje, to powyższe n wektorów jest liniowo zależnych. Utożsamianie dwóch zależności liniowych ma sens, jeżeli jedna z nich powstaje jako niezerowa wielokrotność drugiej, ponieważ wtedy obie opisują tę samą zależność liniową między wektorami. Utożsamienie to czyni ze zbioru wszystkich zależności liniowych między \mathbf v_1, \dots, \mathbf v_n przestrzeń rzutową.

Grupy abelowe i moduły[edytuj]

Pojęcie liniowej niezależności można wprowadzić również w grupach abelowych (notacja addytywna) – należy jedynie zwrócić uwagę na ograniczoną możliwość skalowania wektorów: układ \{\mathsf a_1, \dots, \mathsf a_k\} niezerowych elementów grupy abelowej A nazywa się (liniowo) niezależnym, jeżeli

n_1 \mathsf a_1 + \dots + n_k \mathsf a_k = \mathsf 0

pociąga

n_1 \mathsf a_1 = \dots = n_k \mathsf a_k = \mathsf 0,

gdzie n_i \in \mathbb Z.

Powyższy warunek jest równoważny temu, iż n_i = 0, o ile rząd \operatorname o(\mathsf a_i) = \infty oraz \operatorname o(\mathsf a_i)|n_i, jeżeli \mathrm o(\mathsf a_i) < \infty. W przeciwieństwie do przestrzeni liniowych w ogólności nie jest prawdą, że elementy układu zależnego można zapisać jako kombinację liniową pozostałych: jeśli układ jest zależny, to z równości

n_1 \mathsf a_1 + \dots + n_k \mathsf a_k = \mathsf 0

wynika jedynie, iż co najmniej jeden z wyrazów tej kombinacji, np. n_1 \mathsf a_1, jest różny od \mathsf 0, tzn. prawdziwa jest tylko zależność

n_1 \mathsf a_1 = -n_2 \mathsf a_2 - \dots - n_k \mathsf a_k.

Układ L = \{\mathsf a_i\}_{i \in I} jest niezależny wtedy i tylko wtedy, gdy podgrupa generowana przez L jest sumą prostą grup cyklicznych \langle \mathsf a_i \rangle_{i \in I}.

O elemencie \mathsf g \in A mówi sie, iż jest zależny od podzbioru L zbioru A, jeżeli dla pewnych \mathsf a_i \in L oraz liczb całkowitych n, n_i zachodzi relacja zależności

\mathsf 0 \ne n\mathsf g = n_1 \mathsf \mathsf a_1 + \dots + n_k \mathsf a_k.

Podzbiór K zbioru A jest zależny od L, jeżeli każdy element \mathsf g \in K jest zależny od L. Jeżeli K jest zależny od L, a L jest zależny od K, to o K i L mówi się, że są równoważne.

Układ niezależny M elementów grupy A jest maksymalny, jeżeli nie istnieje układ niezależny elementów A zawierający M w sposób właściwy. Dowolne dwa maksymalne układy niezależne w grupie A są równoważne. Dowodzi się, że układ niezależny M elementów z A jest maksymalny wtedy i tylko wtedy, gdy \langle M \rangle jest podgrupą istotną w A, tzn. ma ona nietrywialne przecięcie z dowolną niezerową podgrupą (cykliczną) grupy A. Każdy maksymalny układ niezależny w podgrupie istotnej grupy A jest maksymalnym układem niezależnym w A.

Okazuje się, że moc wszystkich maksymalnych układów niezależnych grupy jest równa i zależy wyłącznie od A. Wielkość tę nazywa się rangą danej grupy abelowej. Pojęcie rangi o analogicznych własnościach można zdefiniować dla modułów nad dowolną dziedziną całkowitości, przy czym przypadek grup abelowych odpowiada modułom nad pierścieniem liczb całkowitych.

Liniowa zależność zmiennych losowych[edytuj]

Czasami kowariancję nazywa się miarą „zależności liniowej” między dwoma zmiennymi losowymi. Nie jest to to samo pojęcie, co przedstawione wyżej. Znormalizowanie kowariancji daje macierz korelacji, z niej zaś uzyskuje się współczynnik Pearsona, który oddaje wierność dopasowania do najlepszej możliwej funkcji liniowej opisującej relację między tymi zmiennymi. W tym sensie kowariancja jest liniowym wskaźnikiem zależności.

Zobacz też[edytuj]

Linki zewnętrzne[edytuj]