Forma kwadratowa

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania

Forma kwadratowa (funkcjonał kwadratowy) – wielomian jednorodny II stopnia zmiennych określony na przestrzeni liniowej – zmienne występują tu najwyżej w drugiej potędze; ogólna postać

gdzie:

  • – stałe współczynniki liczbowe – całkowite, wymierne, rzeczywiste lub zespolone,
  • – zmienne, współrzędne dowolnego wektora danej przestrzeni liniowej
  • jednorodność II stopnia oznacza, że dla dowolnej liczby zachodzi równość,

W przypadku jednej zmiennej, dwóch zmiennych oraz trzech zmiennych formy nazywa się odpowiednio unarną, binarną i ternarną. Mają one postacie:

gdzie są stałymi współczynnikami[a].

Np.

jest formą kwadratową trzech zmiennych

Funkcje kwadratowe, jak np. w przypadku jednej zmiennej, nie są na ogół formami kwadratowymi, gdyż nie są jednorodne (chyba że oraz są równe 0).

Pojęcie formy kwadratowej zajmuje fundamentalne miejsce w różnych działach matematyki, takich jak np. teoria liczb, algebra liniowa, teoria grup (w tym teoria grup ortogonalnych), geometria różniczkowa (metryka Riemanna, druga forma fundamentalna), topologia różniczkowa.

Uwaga: O ile nie zaznaczono inaczej, w artykule rozpatruje się przestrzenie liniowe nad ustalonym ciałem charakterystyki różnej od 2.

Historia[edytuj | edytuj kod]

Pytania, czy jakaś liczba całkowita spełnia zadaną formę kwadratową, zadawano wiele stuleci temu. Przykładem jest teoria Fermata o sumie dwóch kwadratów, która określa, kiedy istnieje liczba całkowita spełniająca formę gdzie – liczby całkowite. Problem ten jest analogiczny do znajdowania trójek pitagorejskich, który pojawił się w drugim tysiącleciu p.n. Chr.[b]

W 628, Hinduski matematyk Brahmagupta napisał dzieło Brāhmasphuṭasiddhānta zawierające m.in. wyniki badań równań typu W szczególności znalazł rozwiązanie równania (zwanego dziś równaniem Pella) [c]. W Europie problem ten badali Brouncker, Euler and Lagrange.

W 1801 Gauss opublikował dzieło Disquisitiones Arithmeticae, w którym główną część poświęcił teorii binarnych form kwadratowych o współczynnikach całkowitych. Jego idee zostały uogólnione i z czasem odkryto związki z liczbowymi ciałami kwadratowymi, z grupami modularnymi i innymi działami matematyki.

Forma kwadratowa a forma dwuliniowa[edytuj | edytuj kod]

Tw. 1 Każdej formie kwadratowej[d][e] odpowiada wzajemnie jednoznacznie symetryczna forma dwuliniowa określona na tej samej przestrzeni, tak że zachodzą związki

Np.

(a) formą dwuliniową dodatnio określoną i symetryczną jest iloczyn skalarny wektorów

(b) formą kwadratową odpowiadająca jednoznacznie iloczynowi skalarnemu jest iloczyn skalarny wektora przez samego siebie – definiuje on kwadrat normy, która określa długości wektorów przestrzeni liniowej:

Df. Funkcję nazywa się formą dwuliniową odpowiadającą formie (stowarzyszoną z formą ).

Czynnik jest powodem, dla którego wyklucza się ciała, w których formy kwadratowe w ciałach charakterystyki 2 opisano w oddzielnej sekcji.

Wybór bazy a przedstawienie formy[edytuj | edytuj kod]

Jeżeli jest przestrzenią liniową skończonego wymiaru to wybór bazy przestrzeni prowadzi do przedstawienia w postaci jednorodnego wielomianu kwadratowego[f]. Z drugiej strony dowolny jednorodny wielomian II stopnia zadaje we współrzędnych pewnej bazy formę kwadratową na [g].

Właściwości[edytuj | edytuj kod]

Tw. Forma dwuliniowa jest symetryczna.

Df. Formy kwadratowe nazywa się równoważnymi, jeśli równoważne są odpowiadające im formy dwuliniowe[h].

Df. Przestrzeń nazywa się przestrzenią kwadratową.

Df. Przestrzenie i nazywa się izomorficznymi, jeżeli istnieje taki izomorfizm liniowy że

dla wszystkich

Df. Ortogonalną sumą prostą przestrzeni i nazywa się sumę prostą przestrzeni w której zdefiniowano formą kwadratową

Oznaczenie: oznacza -krotną ortogonalną sumę prostą przestrzeni kwadratowej ze sobą.

Df. Wektorem izotropowym względem (bądź ) nazywa się niezerowy wektor dla którego

Innymi słowy: wektor izotropowy to wektor niezerowy, będący rozwiązaniem równania

czyli wektor niezerowy, który jest ortogonalny sam do siebie.

Macierze odpowiadające formom[edytuj | edytuj kod]

(1) Wybierając bazę w formie kwadratowej zdefiniowanej na przestrzeni -wymiarowej, można przypisać macierz symetryczną w następujący sposób:

gdzie jest dowolnym wektorem o współrzędnych takich że nie wszystkie współrzędne są równe zeru; indeks górny oznacza transpozycję.

Macierz nazywaną macierzą formy kwadratowej względem ustalonej bazy[i].

(2) Symetrycznej formie dwuliniowej stowarzyszonej z formą odpowiada identyczna macierz taka że

(3) Zmiana bazy w powoduje, że formie przyporządkowana zostaje inna macierz przy czym zachodzi związek

gdzie jest macierzą zamiany bazy.

Df. Macierze danej formy kwadratowej, wyrażone w różnych bazach, nazywa się macierzami przystającymi.

Df. Wyróżnikiem formy kwadratowej reprezentowanej przez macierz nazywa się liczbę

modulo niezerowe kwadraty,

gdzie wyznacznik macierzy

Df. Formę kwadratową nazywa się niezdegenerowaną (nieosobliwą), gdy jej macierz jest odwracalna, tzn. ma niezerowy wyznacznik.

Diagonalizacja[edytuj | edytuj kod]

 Zobacz też: diagonalizacja.

Df. Forma kwadratowa jest w postaci diagonalnej, jeśli zadana jest jako suma kwadratów współrzędnych wektora tj.

Tw. Forma kwadratowa jest w postaci diagonalnej, jeżeli jej reprezentacja macierzowa jest diagonalna, tzn. wszystkie wyrazy macierzy poza główną przekątną są równe zeru.

Twierdzenie Lagrange’a
Dla każdej formy kwadratowej istnieje baza, w której forma ma postać diagonalną

Tw. Wyznacznik formy kwadratowej w postaci diagonalnej wynosi

[j]

Konstrukcja bazy ortogonalnej

Konstrukcję bazy ortogonalnej można przeprowadzić w oparciu o własności odpowiadającej jej formy dwuliniowej:

  1. należy rozpocząć od wyboru dowolnego wektora dla którego
  2. trzeba wybrać z podprzestrzeni wektor taki że wektory i są ortogonalne i liniowo niezależne,
  3. należy przejść do i wskazać w niej wektor taki że itd.,
  4. proces kończy się na podprzestrzeni, na której zeruje się tożsamościowo:
    1. jeśli jest to podprzestrzeń zerowa, to wybrane wektory tworzą bazę, w której ma postać diagonalną,
    2. w przeciwnym wypadku bazę diagonalizującą na całej przestrzeni tworzą wybrane wektory oraz dowolna baza otrzymanej podprzestrzeni.

Twierdzenia

Następujące stwierdzenie charakteryzuje formy kwadratowe wprowadzające liczby podwójne. Dla formy kwadratowej określonej na przestrzeni dwuwymiarowej następujące warunki są równoważne:

(a) ma ona postać w pewnej bazie,

(b) jej wyróżnik jest równy

(c) jest ona niezdegenerowana i daje wektory izotropowe.

Klasyfikacja[edytuj | edytuj kod]

W tej sekcji będzie niezdegenerowana, zaś oznaczać będzie liczby rzeczywiste liczby zespolone lub dowolne ciało skończone nieparzystej charakterystyki.

Sygnatura[edytuj | edytuj kod]

Twierdzenie[k]
Każda forma kwadratowa na jest równoważna z formą diagonalną

Twierdzenie

Dowolna forma kwadratowa na jest równoważna z formą diagonalną postaci

gdzie

Jeśli to formy

oraz

są równoważne wtedy i tylko wtedy, gdy

i

Wniosek:

Dana forma kwadratowa na jest wyznaczona z dokładnością do równoważności przez parę liczb którą można uzyskać z diagonalizacji formy:

jest liczbą znaków dodatnich,
to liczba znaków ujemnych.

Df. Parę liczb nazywa się sygnaturą formy kwadratowej.

(czasem sygnaturą nazywa się tylko liczbę gdyż jest jednoznacznie wyznaczone przy danym ).

Formy kwadratowe a geometria[edytuj | edytuj kod]

Formy kwadratowe wprowadzają na zbiorze

– mówimy, że formy kwadratowe generują geometrie pseudoriemannowskie (w szczególnym przypadku formy – geometrię euklidesową). Z tego względu formy kwadratowe mają fundamentalne znaczenie dla geometrii różniczkowej.

Określoność formy[edytuj | edytuj kod]

 Zobacz też: określoność formy.

Df. Formę kwadratową na przestrzeni liniowej nad nazywa się dodatnio określoną (lub dodatnią), jeżeli i ujemnie określoną (lub ujemną), gdy dla wszystkich [l]

Tw. Każda dodatnio określona forma na przestrzeni wymiaru jest równoważna sumie kwadratów. Podobnie ma się rzecz z formami określonymi ujemnie.

Własności te nie zależą od wyboru współrzędnych w przestrzeni.

Uniwersalność[edytuj | edytuj kod]

Jeśli jest określona na przestrzeni co najmniej trójwymiarowej nad ciałem skończonym to daje ona wektory izotropowe. W ciele dowolnej charakterystyki pociąga to uniwersalność formy tzn. [m][n]. Choć stwierdzenie o istnieniu wektorów izotropowych w dowolnych przestrzeniach wymiaru 2 nie jest prawdziwe, to prawdą jest, iż dowolna forma na przestrzeni dwuwymiarowej nad ciałem skończonym jest uniwersalna[o].

Twierdzenie
Niech będzie niekwadratem. Dowolna forma kwadratowa na przestrzeni liniowej wymiaru nad ciałem skończonym jest równoważna z dokładnie jedną formą na mianowicie: lub

W szczególności wymiar i wyróżnik wyznaczają formę nad ciałem skończonym w sposób jednoznaczny z dokładnością do równoważności.

Reguła równoległoboku i polaryzacja[edytuj | edytuj kod]

Tw. 1 Dla dowolnej formy kwadratowej zachodzi wzór nazywany regułą równoległoboku[p]

Tw. 2 Podobny wzór

znany również jako tożsamość polaryzacyjna, wyraża formę dwuliniową za pomocą formy kwadratowej jednak w inny sposób niż podany w definicji.

Być może oba powyższe wzory mogą posłużyć do zdefiniowania formy kwadratowej? Zagadnieniem tym zajęli się John von Neumann i Pascual Jordan, którzy dowiedli

Tw. 3 (Jordana-von Neumanna)

Założenia:

(1) spełnia tożsamość

(2) jest określona wzorem

Teza:

jest symetryczna, dwuaddytywna oraz

Dwuaddytywność pociąga -dwuliniowość. Stąd z powyższego twierdzenia jest -dwuliniowa, jeśli jest charakterystyki zero lub -dwuliniowa, jeśli jest charakterystyki Oznacza to, że jeśli lub to forma jest kwadratowa. Jeżeli to forma jest kwadratowa, o ile jest skończonego wymiaru (bądź ogólniej: zupełna), przy dodatkowym założeniu, że jest ciągła (co pociąga ciągłość a stąd jej -dwuliniowość).

Przy oznaczeniach oraz i przyjęciu powyższe twierdzenie mówi, że:

  • w dowolnej przestrzeni Banacha z normą w której spełniona jest tożsamość równoległoboku, można wprowadzić iloczyn skalarny za pomocą tożsamości polaryzacyjnej,
  • wprowadzenie to czyni z przestrzeń Hilberta.

Ciała charakterystyki 2[edytuj | edytuj kod]

O ile nie zaznaczono inaczej, niżej przestrzenie liniowe określone są nad ustalonym ciałem charakterystyki 2.

Niech będzie przestrzenią liniową. Przekształcenie nazywa się formą kwadratową albo funkcjonałem kwadratowym na jeżeli:

  • jest jednorodne II stopnia,
  • następująca funkcja jest dwuliniowa:

Definicja we współrzędnych nie ulega zmianie: forma kwadratowa to jednorodna, kwadratowa funkcja wielomianowa. Podobnie definiuje się pozostałe pojęcia i dowodzi równoważności definicji abstrakcyjnej i z ustaloną bazą. Zasadniczą różnicą jest postać macierzowa: macierz formy kwadratowej jest górnotrójkątna, nie zaś symetryczna; macierz odpowiadającej jej formy dwuliniowej jest z kolei symetryczna z zerami na przekątnej głównej[q]. Niekiedy powyższą definicję stosuje się dla ciał dowolnej charakterystyki[r], jednak przyjęcie jej sprawia, iż forma dwuliniowa stowarzyszona z formą kwadratową wyrażającą się sumą kwadratów nie daje standardowego iloczynu skalarnego, lecz jego dwukrotność.

Jest wtedy i tylko wtedy, gdy wszystkie elementy macierzy spoza przekątnej głównej znikają (równoważnie: wtedy i tylko wtedy, gdy jest diagonalizowalna w pewnej bazie). Gdy charakterystyka nie jest równa 2, wyrazy spoza przekątnej dowolnej formy kwadratowej zerują się w odpowiedniej bazie, jednakże wyrazy spoza przekątnej głównej w potrzebne w ciele charakterystyki 2, gdy stowarzyszona z nią symetryczna forma dwuliniowa nie jest zerowa. Z definicji dowolna forma kwadratowa (w ciele charakterystyki 2) ma powiązaną symetryczną formę dwuliniową, choć odpowiedniość między formami kwadratowymi a symetrycznymi formami dwuliniowymi nie jest iniektywna, ani surjektywna: różne formy kwadratowe (np. oraz ) mogą mieć tę samą symetryczną formę dwuliniową, a pewne symetryczne formy dwuliniowe (np. ) nie są formami dwuliniowymi jakichkolwiek form kwadratowych. W języku macierzy każda forma kwadratowa w ciele charakterystyki różnej od 2 może być zapisana jako gdzie jest pewną macierzą symetryczną, nie jest to jednak prawda w ciele charakterystyki 2. Forma kwadratowa przedstawiona w baie z wyrazami poza przekątną nie jest reprezentowana przez macierz symetryczną w jakiekolwiek bazie. Jednakże odpowiadająca jej forma dwuliniowa jest zawsze reprezentowana za pomocą macierzy symetrycznej (zob. wyżej). Dlatego nie wolno mylić macierzy formy kwadratowej w ciele charakterystyki 2 z macierzą postaci jej formy dwuliniowej.

Kluczową obserwacją jest to, że symetryczna forma dwuliniowa stowarzyszona z formą kwadratową w ciele charakterystyki 2 jest alternująca:

W ciele charakterystyki innej niż 2 można odzyskać z gdyż ale dla charakterystyki 2 jest Ponieważ dowolna alternująca forma dwuliniowa jest symetryczna w ciele charakterystyki 2, to o odpowiedniości z do w ciele charakterystyki 2 należy myśleć jako o przekształceniu form kwadratowych w alternujące (a nie tylko symetryczna) formy dwuliniowe. Wówczas jest ono surjektywne, ale nadal nigdy nie jest iniektywne, tzn. nie istnieje żaden odpowiednik polaryzacji dla charakterystyki 2, a więc sama wiedza o nie wystarcza do odzyskania informacji o Zatem choć w ciele charakterystyki różnej od 2 pewne pojęcia można wyrazić równie dobrze w języku form kwadratowych bądź symetrycznych form kwadratowych, to w ciele charakterystyki 2 ich wyrażenie w obu tych językach może być niemożliwe.

Uwagi[edytuj | edytuj kod]

  1. Tradycja zapoczątkowana przez Gaussa każe używać parzystych współczynników przy iloczynach różnych zmiennych, tj. w postaci zamiast w formach binarnych oraz zamiast w formach ternarnych. Obie konwencje są stosowane w literaturze.
  2. Babylonian Pythagoras.
  3. Brahmagupta biography.
  4. Niektórzy autorzy terminy „forma” i „funkcjonał” bądź traktują synonimicznie, bądź stosują tylko jeden z nich, np. Komorowski (s. 104) i Więsław (s. 217) używają jedynie określenia „forma kwadratowa”, podając definicję odwzorowania przestrzeni liniowej w ciało skalarów. Inni, np. Gleichgewicht (s. 179–180) czy Newelski (rozdz. 14), odróżniają „funkcjonał” (przekształcenie, funkcja wielomianowa, przedstawienie niezależne od współrzędnych) od „formy” (wyrażenie formalne, wielomian, przedstawienie w bazie). W tym podejściu „forma kwadratowa” jest przedstawieniem „funkcjonału kwadratowego” w ustalonej bazie, co wyjaśniono w definicji; w tym artykule nie stosuje się tej konwencji.
  5. Poniższy warunek można przedstawić w dogodniejszej postaci w szczególności jest równoważne co czyni z funkcję addytywną tej przestrzeni liniowej.
  6. Indukcja po liczbie wyrazów daje dla dowolnego i wektorów Stąd jeżeli jest bazą tej przestrzeni, to gdzie oraz
  7. Jeśli jest postaci wielomianowej jak wyżej, to natychmiast otrzymuje się pierwszą część definicji, dla dowolnego z kolei dla oraz uzyskuje się drugą, przy oznaczeniach oraz W notacji macierzowej wzór ten można wyrazić jako gdzie kropka oznacza standardowy iloczyn skalarny przestrzeni współrzędnych zaś oraz
    jest macierzą formy dwuliniowej na co czyni zadość definicji formy kwadratowej.
  8. Na mocy tożsamości polaryzacyjnej.
  9. Wynika to wprost z zapisania w postaci wielomianowej z macierzą o postaci jak w przypisie wyżej.
  10. Niech będzie bazą ortogonalną stowarzyszonej z symetrycznej formy dwuliniowej (istnieje zawsze dla ciał charakterystyki różnej od 2); w bazie tej wyrazy mieszane znikają, a więc jest w postaci diagonalnej; macierz jest wówczas diagonalna, a więc jej wyróżnik jest wymaganej postaci.
  11. Twierdzenie to można uogólnić na zdegenerowane formy kwadratowe – nazywa się je wtedy twierdzeniem Sylvestera-Jacobiego o bezwładności form kwadratowych.
  12. Niezdegenerowane formy kwadratowe, które nie są ani dodatnio, ani ujemnie określone, nazywa się nieokreślonymi. Rozpatruje się także nierówności nieostre: mówi się wtedy o formach określonych niedodatnio i nieujemnie (bądź półokreślonych dodatnio i ujemnie).
  13. Niech będzie wektorem, dla którego ponieważ a (z niezdegenerowania), to z niezdegenerowania formy istnieje dla którego stowarzyszona forma dwuliniowa Wówczas dla dowolnego zachodzi czyli jest to funkcja liniowa zmiennej która przyjmuje wszystkie wartości z
  14. Twierdzenie jest fałszywe, gdy jest zdegenerowana, np. na gdzie
  15. Po przedstawieniu formy w postaci diagonalnej wystarczy dowieść, iż wielomian postaci przyjmuje wszystkie wartości z dla otóż forma gdzie jest niekwadratem, przyjmuje zero wyłącznie dla co dowodzi różnowartościowości tej funkcji liniowej zmiennej Wynik ten tłumaczy też dlaczego ograniczenie w pierwszym twierdzeniu jest ostre.
  16. Wzór ten łatwo wyprowadzić z alternatywnej postaci drugiego wzoru definiującego: wystarczy dodać go do siebie, przy czym jeden z nich z podstawieniem Odjęcie ze wspomnianym podstawieniem daje kolejny.
  17. Formalnie jest to macierz pomnożona przez 2.
  18. Wówczas związek między formą kwadratową a odpowiadającą jej symetryczną formą dwuliniową wyraża się wzorem

Zobacz też[edytuj | edytuj kod]

Typy form

Własności

Przykłady form w geometrii

Bibliografia[edytuj | edytuj kod]

  • H. Guściora, M. Sadowski, Repetytorium z algebry liniowej, PWN, Warszawa 1979, s. 123–138.
  • T. Trajdos, Matematyka dla inżynierów, PWN, Warszawa 1974, s. 73–77.
  • Więsław, Witold: Algebra geometryczna. Skrypt dla studentów matematyki. Wydawnictwa Uniwersytetu Wrocławskiego, Wrocław 1974.
  • Komorowski, Jacek: Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk, Państwowe Wydawnictwo Naukowe, Warszawa 1978.
  • Gleichgewicht, Bolesław: Algebra. Podręcznik dla kierunków nauczycielskich studiów matematycznych, Państwowe Wydawnictwo Naukowe, Warszawa 1983. Wydanie III. ​ISBN 83-01-03903-5​.
  • Newelski, Ludomir: Algebra liniowa II, Rozdział 14. W przygotowaniu.

Linki zewnętrzne[edytuj | edytuj kod]