Iloczyn skalarny

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj
Ujednoznacznienie Ten artykuł dotyczy iloczynu skalarnego przestrzeni euklidesowych. Zobacz też: iloczyn skalarny określany w abstrakcyjnych przestrzeniach liniowych.

Iloczyn skalarny – w matematyce pewna forma dwuliniowa na danej przestrzeni liniowej, tj. dwuargumentowa funkcja o szczególnych własnościach przyporządkowująca dwóm wektorom danej przestrzeni liniowej wartość skalarną. Czasami spotyka się również nazwę iloczyn wewnętrzny, który zwykle odnosi się jednak do ogólnych iloczynów skalarnych wprowadzanych w abstrakcyjnych przestrzeniach liniowych nazywanych wtedy przestrzeniami unitarnymi; przestrzenie afiniczne z wyróżnionym iloczynem skalarnym nazywa się przestrzeniami euklidesowymi.

Zasadniczym celem wprowadzania iloczynu skalarnego w danej przestrzeni liniowej jest wprowadzenie na niej geometrii euklidesowej, w szczególności kąta między dwoma wektorami, co umożliwia mówienie o ich prostopadłości (nazywanej w tym kontekście ich ortogonalnością, która jest nieznacznym uogólnieniem) oraz obrotu. Iloczyn skalarny stanowi więc pomost między geometrią syntetyczną a geometrią analityczną. Ponieważ trójwymiarowa przestrzeń euklidesowa jest dobrym przybliżeniem świata rzeczywistego w skali makroskopowej, to iloczyn skalarny w niej określony znajduje zastosowanie fizyce klasycznej, np. mechanice klasycznej (branie rzutów wektora siły wypadkowej jest tego przykładem); z kolei w mechanice kwantowej rozpatruje się (nieskończeniewymiarowe) przestrzenie Hilberta, czyli przestrzenie liniowe (nieskończonego wymiaru) z iloczynem skalarnym i dodatkową strukturą topologiczną (zob. Uogólnienia). Przykładowo praca mechaniczna \scriptstyle W to wielkość fizyczna wyrażająca się jako iloczyn skalarny siły \scriptstyle \mathbf F oraz przemieszczenia \scriptstyle \mathbf r.

W artykule opisano iloczyn skalarny określony na rzeczywistych przestrzeniach współrzędnych[1] \scriptstyle \mathbb R^n oraz \scriptstyle \mathrm{Mat}_{n \times 1}(\mathbb R) wymiaru \scriptstyle n, wraz z ortonormalną bazą standardową, nazywany też zwykłym, standardowym (w przestrzeniach afinicznych nazywa się go także euklidesowym); niżej określenia te będą pomijane (użyto notacji ustalonej w artykule o przestrzeniach współrzędnych[2]). Uogólnienia opisano w oddzielnej sekcji.

Definicja i własności[edytuj | edytuj kod]

Information icon.svg Zobacz też: forma dwuliniowa.

Standardowy iloczyn skalarny definiuje się wzorem

\mathbf a \cdot \mathbf b = a_1 b_1 + \dots + a_n b_n,

w przypadku macierzowym (wykorzystując własności mnożenia macierzy) można go zapisać w postaci

\mathbf A \cdot \mathbf B = \mathbf A^\mathrm T \mathbf B,

gdzie \scriptstyle \mathbf A^\mathrm T oznacza transpozycję macierzy \scriptstyle \mathbf A. Wzór ten jest użyteczny także w ogólnym przypadku[3], lecz w przypadku przestrzeni liniowych wzór ten opisuje formę dwuliniową, tj. funkcję \scriptstyle \mathbb R^n \times \mathbb R^n \to \mathbb R, mającą szereg własności, które służą często jako abstrakcyjna, tzn. niezależna od współrzędnych, definicja iloczynu skalarnego (zob. przestrzeń unitarna). Wśród najważniejszych można wymienić:

Jeśli \scriptstyle \mathbf a \cdot \mathbf b = 0, to wektory \scriptstyle \mathbf a oraz \scriptstyle \mathbf b nazywa się ortogonalnymi. Wprost z definicji wynika, że jeśli choć jeden czynnik jest wektorem zerowym, to iloczyn skalarny również jest zerowy; może się jednak zdarzyć, iż \scriptstyle \mathbf a \cdot \mathbf b = 0, choć \scriptstyle \mathbf a \ne \mathbf 0 oraz \scriptstyle \mathbf b \ne \mathbf 0 (zob. Przykłady); mówi się wtedy czasem o prostopadłości tych wektorów. Wektory zerowe są więc jedynym elementem odróżniającym ortogonalność od prostopadłości (geometrycznie wektor zerowy odpowiada punktowi, można więc uważać, że dowolny punkt jest prostopadły do wektora, odcinka, czy prostej); w oznaczeniach nie odróżnia się zwykle jednego pojęcia od drugiego oznaczając oba symbolem \scriptstyle \mathbf a \perp \mathbf b.

Wynika stąd, że iloczyn skalarny, w przeciwieństwie do mnożenia liczb, nie spełnia prawa skracania (tj. z równości \scriptstyle xy = xz nie wynika \scriptstyle y = z, o ile tylko \scriptstyle x \ne 0). Otóż jeśli \scriptstyle \mathbf a \cdot \mathbf b = \mathbf a \cdot \mathbf c, to z prawa rozdzielności zachodzi \scriptstyle \mathbf a \cdot (\mathbf b - \mathbf c) = 0, co jest możliwe wtedy, gdy są ortogonalne (tj. jeden z tych wektorów jest zerowy: \scriptstyle \mathbf a = \mathbf 0 lub \scriptstyle \mathbf b = \mathbf c, bądź są one prostopadłe, tzn. \scriptstyle \mathbf a \perp (\mathbf b - \mathbf c)).

Przykłady[edytuj | edytuj kod]

Iloczyn skalarny dwóch trójwymiarowych wektorów \scriptstyle ({\color{RoyalPurple}1}, {\color{RoyalPurple}3}, {\color{RoyalPurple}-5}) oraz \scriptstyle ({\color{Maroon}4}, {\color{Maroon}-3}, {\color{Maroon}-1}) wynosi

({\color{RoyalPurple}1}, {\color{RoyalPurple}3}, {\color{RoyalPurple}-5}) \cdot ({\color{Maroon}4}, {\color{Maroon}-3}, {\color{Maroon}-1}) = {\color{RoyalPurple}1} \cdot {\color{Maroon}4} + {\color{RoyalPurple}3} \cdot ({\color{Maroon}-3}) + ({\color{RoyalPurple}-5}) \cdot ({\color{Maroon}-1}) = 0,

choć żaden z tych wektorów nie jest zerowy – oznacza to, że wektory te są ortogonalne (prostopadłe).

W jednowymiarowej przestrzeni \scriptstyle \mathbb R iloczyn skalarny dany jest jako zwykłe mnożenie. Innym przykładem iloczynu skalarnego jest tzw. iloczyn wewnętrzny Frobeniusa, który jest iloczynem skalarnym na przestrzeni macierzy ustalonego typu danym „po współrzędnych”, tj. jako suma iloczynów odpowiadających sobie elementów tych macierzy (macierze dwuwymiarowe są więc traktowane jak „długie” wektory jednowymiarowe).

Interpretacja geometryczna[edytuj | edytuj kod]

|A|•cos(θ) jest rzutem A na B

Iloczyn skalarny umożliwia wprowadzenie „długości” wektora, tj. jego modułu lub normy, mianowicie

|\mathbf a| = \sqrt{\mathbf a \cdot \mathbf a} = \sqrt{a_1^2 + \dots + a_n^2},

przy czym wielkość ta jest poprawnie zdefiniowana, gdyż wyrażenie podpierwiastkowe jest nieujemne (na mocy dodatniej określoności); jest to standardowa „długość” wektora dana z kilkukrotnego zastosowania twierdzenia Pitagorasa.

Kąt \scriptstyle \theta między wektorami \scriptstyle \mathbf a oraz \scriptstyle \mathbf b dany jest wzorem

\theta = \mathrm{arccos}\; \frac{\mathbf a \cdot \mathbf b}{|\mathbf a| |\mathbf b|},

gdzie \scriptstyle \mathrm{arccos} oznacza funkcję arcus cosinus (odwrotną do funkcji cosinus). Otóż jeśli wektory \scriptstyle \mathbf a, \mathbf b leżą względem siebie pod kątem \scriptstyle \theta, a wektor \scriptstyle \mathbf c jest dany jako \scriptstyle \mathbf c = \mathbf a - \mathbf b, dzięki czemu wektory te tworzą trójkąt, to zgodnie z twierdzeniem cosinusów dla tego trójkąta zachodzi

|\mathbf c|^2 = |\mathbf a|^2 + |\mathbf b|^2 - 2|\mathbf a| |\mathbf b| \cos \theta,

a ponieważ kwadrat modułu jest równy iloczynowi skalarnemu wektora przez siebie, to

\mathbf c \cdot \mathbf c = \mathbf a \cdot \mathbf a + \mathbf b \cdot \mathbf b - 2|\mathbf a| |\mathbf b| \cos \theta,

skoro jednak \scriptstyle \mathbf c = \mathbf  a - \mathbf b, to także

\mathbf c \cdot \mathbf c = (\mathbf a - \mathbf b) \cdot (\mathbf a - \mathbf b),

czyli

\mathbf c \cdot \mathbf c = \mathbf a \cdot \mathbf a + \mathbf b \cdot \mathbf b - 2(\mathbf a \cdot \mathbf b)

na mocy prawa rozdzielności. Porównując pierwsze i trzecie równanie na \scriptstyle \mathbf c \cdot \mathbf c otrzymuje się

\mathbf a \cdot \mathbf a + \mathbf b \cdot \mathbf b - 2(\mathbf a \cdot \mathbf b) = \mathbf a \cdot \mathbf a + \mathbf b \cdot \mathbf b - 2|\mathbf a| |\mathbf b| \cos \theta,

co po redukcji wyrazów podobnych i skróceniu czynnika \scriptstyle (-2) daje

\mathbf a \cdot \mathbf b = |\mathbf a| |\mathbf b| \cos \theta.

Wielkość \scriptstyle |\mathbf a| \cos \theta jest równa długości (modułowi) rzutu wektora \scriptstyle \mathbf a na wektor \scriptstyle \mathbf b, stąd powyższy wzór umożliwia geometryczną interpretację iloczynu skalarnego jako iloczynu długości tego rzutu przez długość \scriptstyle \mathbf b. Z postaci tej można dużo łatwiej odczytać, iż (niezerowe) wektory prostopadłe, tj. takie, dla których \scriptstyle \theta jest nieparzystą wielokrotnością \scriptstyle 90^\circ, mają iloczyn skalarny równy zeru.

Uogólnienia[edytuj | edytuj kod]

Przestrzenie liniowe[edytuj | edytuj kod]

Information icon.svg Zobacz też: przestrzeń liniowabaza.

Opisane w artykule własności geometryczne wynikają w dużej części z ustalenia bazy ortonormalnej, jaką jest baza standardowa. W gruncie rzeczy pojęcie prostopadłości ma sens geometryczny i przy podanej definicji wymaga bazy standardowej, z kolei ortogonalność jest definiowana za pomocą iloczynu skalarnego i pokrywa się z prostopadłością w przypadku użycia bazy standardowej. Jednakże różnice między tymi pojęciami często rozmywa się, gdyż dla dowolna przestrzeń liniowa skończonego wymiaru ma tę samą strukturę, co przestrzeń współrzędnych o tej samej liczbie wymiarów (przestrzenie te są izomorficzne).

Osobnym zagadnieniem jest trudność zdefiniowania pojęć geometrycznych (nawet w przypadku przestrzeni współrzędnych) w przypadku więcej niż trzech wymiarów – iloczyn skalarny jest wygodnym sposobem wprowadzenia zarówno długości (tj. normy), jak i kąta. Struktura unitarna (tj. obecność iloczynu skalarnego) czyni z przestrzeni liniowej przestrzeń unormowaną, która z kolei wprowadza w niej strukturę metryczną (pojęcie odległości). Stopniowe odrzucanie dodatkowych struktur umożliwiło wyabstrahowanie uogólnień pojęć długości i odległości właśnie w postaci normy i metryki.

Z interpretacji geometrycznej można się przekonać, iż standardowy iloczyn skalarny jest niezmienniczy ze względu na izometrie: obroty, odbicia (w przypadku przestrzeni afinicznych: przekształcenia afiniczne zachowujące początek przestrzeni). Przekształcenia liniowe, które zachowują powyższe własności, a w ogólności: przekształcenia, które zachowują iloczyn skalarny, nazywa się przekształceniami unitarnymi lub ortogonalnymi, a macierze tych przekształceńmacierzami unitarnymi lub ortogonalnymi. Innymi słowy przekształcenia unitarne przeprowadzają bazy ortonormalne na bazy ortonormalne, tj. zachowują normy wektorów (są izometriami) i kąty między nimi (są przekształceniami równokątnymi zachowującymi orientację), w szczególności mają jednostkowy wyznacznik i ślad równy stopniowi macierzy.

Przestrzenie unitarne[edytuj | edytuj kod]

Information icon.svg Osobny artykuł: przestrzeń unitarna.

Intuicje geometryczne pochodzące od przestrzeni współrzędnych mogą jednak nie wystarczać, gdy rozpatruje się abstrakcyjne przestrzenie liniowe, np. przestrzeń wielomianów jednej zmiennej, bądź przestrzeń funkcyjną funkcji całkowalnych z kwadratem o wartościach rzeczywistych określonych na odcinku jednostkowym – obie te przestrzenie mają nieskończone bazy (różnych mocy; są one izomorficzne z przestrzeniami współrzędnych odpowiednio: nieskończoną i uogólnioną, zob. przykłady przestrzeni liniowych), jednak możliwe jest w nich określenie iloczynu skalarnego: odpowiednio wzorem \scriptstyle \mathrm f \cdot \mathrm g = \sum f_i g_i, gdzie \scriptstyle \mathrm h = h_0 + h_1 X + h_2 X^2 + \dots jest wielomianem zmiennej \scriptstyle X, przy czym suma ta jest zawsze skończona (z definicji wielomianu), oraz \scriptstyle f \cdot g = \int f(x) g(x)\; \mathrm dx (całka istnieje z założenia). Z powodu możliwości pomylenia zwykłego iloczynu funkcji z ich iloczynem skalarnym ten drugi oznacza się zwykle symbolami \scriptstyle \langle s, t \rangle;\ (s, t), co może z kolei prowadzić do pomyłki z oznaczeniami przedziałów bądź pary uporządkowanej, bądź nawet \scriptstyle \langle s | t \rangle,\ (s|t).

Reprezentacja macierzowa[edytuj | edytuj kod]

Iloczyn skalarny, jak każdą formę dwuliniową, można przedstawić w postaci macierzy; przykładowo niech \scriptstyle E = \{\mathbf E_1, \dots, \mathbf E_n\} będzie bazą (niekoniecznie standardową) przestrzeni \scriptstyle \mathrm{Mat}_{n \times 1}(\mathbb R). Iloczyn skalarny wektorów (kolumnowych) tej przestrzeni dany jest wtedy jako

\mathbf A \cdot \mathbf B = \mathbf A_E \mathbf M \mathbf B^E,

gdzie \scriptstyle \mathbf V^E oznacza wektor kolumnowy, a \scriptstyle \mathbf V_E to wektor wierszowy współrzędnych wektora (kolumnowego) \scriptstyle \mathbf V wyrażonych w bazie \scriptstyle E[6], zaś macierz \scriptstyle \mathbf M stopnia \scriptstyle n jest reprezentacją macierzową iloczynu skalarnego (która musi być dodatnio określona i symetryczna) w bazie \scriptstyle E opisywanego wzorem

\mathbf M = \begin{bmatrix} \mathbf E_1 \cdot \mathbf E_1 & \dots & \mathbf E_1 \cdot \mathbf E_n \\ \vdots & \ddots & \vdots \\ \mathbf E_n \cdot \mathbf E_1 & \dots & \mathbf E_n \cdot \mathbf E_n \end{bmatrix};

w szczególności jeśli \scriptstyle E jest bazą standardową, to \scriptstyle \mathbf M = \mathbf I jest macierzą jednostkową, co prowadzi przedstawionego w sekcji Definicja wzoru dla macierzy.

Zobacz też[edytuj | edytuj kod]

Linki zewnętrzne[edytuj | edytuj kod]

Przypisy

  1. Wektory w przestrzeni współrzędnej (jak w dowolnej przestrzeni liniowej) zaczepione są w jej początku (zob. wektor zerowy); można także rozpatrywać przestrzenie afiniczne, w których wektory zaczepione mogą być w dowolnych punktach, jednak iloczyn skalarny może być obliczany wyłącznie dla wektorów o wspólnym początku.
  2. Elementy przestrzeni \scriptstyle \mathbb R^n, czyli ciągi \scriptstyle n-elementowe (zapisywane w nawiasach okrągłych), nazywane będą wektorami i oznaczane będą małymi, półtłustymi, prostymi literami alfabetu łacińskiego, z kolei elementy przestrzeni \scriptstyle \mathrm{Mat}_{n \times 1}(\mathbb R), czyli macierze jednokolumnowe o \scriptstyle n wierszach (zapisywane w nawiasach kwadratowych), nazywane będą wektorami kolumnowymi i oznaczane dużymi, półtłustymi, prostymi, literami alfabetu łacińskiego; składowe wektorów (kolumnowych) i skalary będą zapisywane pismem pochyłym; oznaczenia literowe wektorów i ich składowych pokrywają się, numer składowej wskazano w indeksie dolnym.
  3. Tj. w przypadku modułów nad pierścieniami; zob. moduł dualny i para dualna.
  4. Rozdzielność wraz ze zgodnością z mnożeniem przez skalar, tj. addytywność i jednorodność, ze względu na każdy argument nazywa się liniowością (por. forma liniowa); własność ta zachodzi ona ze względu na każdy z dwóch czynników, w tej sytuacji mówi się o dwuliniowości (por. forma dwuliniowa).
  5. Dodatnia określoność wynika z niezdegenerowania w przypadku rzeczywistym (i zespolonym, gdzie dwuliniowość zastępuje się w tym celu półtoraliniowością).
  6. Tj. \scriptstyle (\mathbf V_E)^\mathrm T = \mathbf V^E; jeśli \scriptstyle \mathbf V_E jest wektorem kolumnowym współrzędnych wektora \scriptstyle \mathbf V w bazie \scriptstyle E, to \scriptstyle \mathbf A \cdot \mathbf B = (\mathbf A_E)^\mathrm T \mathbf M \mathbf B_E.