Równanie sześcienne

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Równanie sześcienne lub trzeciego stopniarównanie algebraiczne postaci ax^3+bx^2+cx+d=0, gdzie a\neq 0. Każde równanie sześcienne o współczynnikach rzeczywistych ma przynajmniej jeden pierwiastek rzeczywisty.

W dalszych częściach tego artykułu w pełni przedstawimy metodę rozwiązywania równań sześciennych o współczynnikach zespolonych.

Rys historyczny[edytuj | edytuj kod]

Równania sześcienne zostały rozwiązane w pierwszej połowie XVI wieku. W tamtym czasie w Europie nie używano jeszcze liczb ujemnych i każde równanie zapisywano tak aby wszystkie współczynniki były dodatnie. Rozważano więc szereg różnych typów równań trzeciego stopnia. Matematycy wiedzieli jednak, że rozwiązanie ogólnego równania trzeciego stopnia może być zredukowane do rozwiązania jednego z następujących dwóch typów równań:

x^3 + mx = n oraz x^3 = mx + n (gdzie m,n>0).

Włoski matematyk Scipione del Ferro podał metodę rozwiązania jednego z tych typów, a prawdopodobnie też i drugiego. Nie rozgłaszał on swoich odkryć i przekazał on swoją metodę jedynie paru osobom, np. jego student Fior wiedział, jak rozwiązać równanie pierwszego typu. Del Ferro zapisywał wszystkie swoje odkrycia w notatniku, który po jego śmierci przeszedł w posiadanie Hannibala Nave, zięcia del Ferro. (Nave był również matematykiem i po śmierci teścia w 1526 r. przejął jego posadę na Uniwersytecie Bolońskim).

Niezależnie (ale i później) równania te były rozwiązane przez Niccolo Tartaglię. Potrafił on rozwiązać niektóre typy równań, kiedy w 1535 zaaranżowano mecz matematyczny pomiędzy Fiorem a Tartaglią. W czasie tej debaty każda ze stron podała drugiej 30 równań do rozwiązania. Podczas gdy zadania przygotowane przez Tartaglię były bardzo różnorodne, te podane przez Fiora dotyczyły tylko jedynego typu równań, które Fior potrafił rozwiązać. Rankiem 13 lutego 1535 Tartaglia odkrył sposób na rozwiązywanie tego typu równań i mecz wygrał. Swojej metody rozwiązywania równań Tartaglia nie chciał jednak ogłosić.

Girolamo Cardano uprosił Tartaglię w 1539 r. o wyjawienie metody rozwiązywania równań sześciennych, w zamian zobowiązując się do dochowania tajemnicy i nieujawniania metody. W 1540 r., Lodovico Ferrari, asystent Cardana, odkrył metodę redukcji równań czwartego stopnia do równań sześciennych. Razem z metodą rozwiązywania tych ostatnich pozwalało to rozwiązać wszystkie typy równań stopnia 4, jednak odkrycie to nie mogło zostać opublikowanym ze względu na obietnicę daną Tartaglii.

W 1543 r. Cardano i Ferrari odwiedzili Nave, zięcia del Ferro, w Bolonii i dowiedzieli się od niego, że to del Ferro był pierwszym matematykiem, który rozwiązał równania trzeciego stopnia. Cardano uznał, że obietnica dana Tartaglii nie obowiązuje go więcej i opublikował metodę rozwiązywania równań 3. i 4. stopnia w swoim dziele Ars Magna w 1545.

Sprowadzenie do postaci kanonicznej[edytuj | edytuj kod]

Najpierw pokażemy, że równanie

ax^3+bx^2+cx+d=0
(1)

może być sprowadzone do tak zwanej postaci kanonicznej:

y^{3}+py+q=0.
(2)

Dzieląc obie strony równania (1) przez a, otrzymujemy

x^{3}+\frac{b}{a}x^2+\frac{c}{a}x+\frac{d}{a}=0,

i stosując podstawienie x=y-\frac{b}{3a}, mamy

\left(y-\frac{b}{3a}\right)^{3}+\frac{b}{a}\left(y-\frac{b}{3a}\right)^2+\frac{c}{a}\left(y-\frac{b}{3a}\right)+\frac{d}{a}=0.

Po wymnożeniu, uproszczeniu i poszeregowaniu według potęg otrzymujemy

y^{3}-y^{2}\frac{b}{a}+y^{2}\frac{b}{a}+y\frac{b^{2}}{3a^{2}}-y\frac{2b^{2}}{3a^{2}}+y\frac{c}{a}-\frac{b^{3}}{27a^{3}}+\frac{b^{3}}{9a^{3}}-\frac{bc}{3a^{2}}+\frac{d}{a}=0.

Wyraz z kwadratem znika i równanie wygląda tak:

y^{3}+y\left(\frac{c}{a}-\frac{b^{2}}{3a^{2}}\right)+\frac{2b^{3}}{27a^{3}}+\frac{d}{a}-\frac{bc}{3a^{2}}=0.

Następnie należy zastosować 2 podstawienia:

p=\frac{c}{a}-\frac{b^{2}}{3a^{2}},
q=\frac{2b^{3}}{27a^{3}}+\frac{d}{a}-\frac{bc}{3a^2}.

Otrzymujemy równanie w postaci kanonicznej (2). Każdy pierwiastek tego równania wyznacza pierwiastek równania (1).

Tak więc, jeśli wskażemy jak rozwiązywać równania w postaci kanonicznej, to będziemy mogli rozwiązać każde równanie trzeciego stopnia.

Warto zauważyć, że sprowadzenie do postaci kanonicznej łatwo wykonywać, stosując schemat Hornera, ponieważ y=x+\frac{b}{3a} i więc poszukiwanie współczynników odpowiedniego wielomianu z y to faktycznie rozkładanie wielomianu względem potęg dwumianu x+\frac{b}{3a}.

Rozwiązywanie równań kanonicznych[edytuj | edytuj kod]

Zwróćmy uwagę, że jeśli znajdziemy jeden pierwiastek y_0 równania

y^{3}+py+q=0,
(2)

to na mocy tzw. twierdzenia Bézout możemy podzielić wielomian y^{3}+py+q przez y-y_0, redukując nasze równanie do równania kwadratowego. Rozwiązując to równanie możemy znaleźć pozostałe rozwiązania równania (2). Poniżej najpierw przedstawimy metodę znajdowania jednego pierwiastka naszego równania, a później bardziej szczegółowo opiszemy sposób na znajdowanie wszystkich rozwiązań tego równania.

Jak znaleźć jeden pierwiastek[edytuj | edytuj kod]

Rozważamy równanie

y^{3}+py+q=0.
(2)

Jeśli p=0, (a jest to wtedy gdy c = \frac{b^2}{3a}) to znalezienie rozwiązania tego równania sprowadza się do znalezienia liczby, która podniesiona do trzeciej potęgi da nam -q, a to po prostu pierwiastek sześcienny z -q. Poniżej będziemy więc zakładać, że p\neq 0.

Przyjmujemy, że y=u+v. Wówczas

y^{3}=v^{3}+3uv^{2}+3u^{2}v+u^{3}=3uv(u+v)+u^{3}+v^{3}=3uvy+u^{3}+v^{3}.
(3)

Po dalszym uporządkowaniu informacji ze wzoru (3) otrzymujemy równanie

y^{3}-3uvy-(u^{3}+v^{3})=0.
(4)

Zauważamy, że jeśli

3uv=-p oraz u^{3}+v^{3}=-q
(5)

(a y=u+v), to y spełnia równanie (4) wtedy i tylko wtedy, gdy spełnia on równanie (2). Rozwiązując układ równań (5), otrzymujemy u=\frac{-p}{3v} oraz

\left(\frac{-p}{3v}\right)^{3}+v^{3}+q=0.

Stąd

v^{3}-\frac{p^{3}}{27v^{3}}+q=0.

Po pomnożeniu przez v^{3} otrzymamy

(v^{3})^{2}+q(v^{3})-\frac{p^{3}}{27}=0.

Podstawiając za v^{3} zmienną pomocniczą z, otrzymujemy równanie kwadratowe:

z^{2}+qz-\frac{p^{3}}{27}=0.
(6)

Równanie (6) ma pierwiastek (możliwe że zespolony):

z_0=\frac{-q+\sqrt{q^2+4p^3/27}}{2}.

Następnie wybieramy liczbę v_0 taką, że (v_0)^3=z_0. Kładziemy u_0=\frac{-p}{3v_0}  i zauważamy że v_0,u_0 spełniają równania (5). Jeśli więc położymy

y_0=v_0+u_0,

to liczby y_0,v_0,u_0 będą spełniać równanie (4), czyli

y_0 jest pierwiastkiem równania (2).

Wszystkie rozwiązania: wzory Cardano[edytuj | edytuj kod]

Poniżej będzie przedstawiona metoda, pozwalająca otrzymać wszystkie pierwiastki równania (2), jeśli jeden został już znaleziony według powyższej metody. Niech \varepsilon_0,\varepsilon_1,\varepsilon_2 będą pierwiastkami 3. stopnia z jedynki, tzn.

\varepsilon_0=1,   \varepsilon_1=\frac{-1 + i\sqrt 3}{2},  \varepsilon_2= \frac{-1 - i\sqrt 3}{2}.

Tak jak wcześniej, niech z_0 będzie pierwiastkiem równania (6):

z_0=\frac{-q+\sqrt{q^2+4p^3/27}}{2}.

Ustalmy liczby v_0, u_* takie, że

(v_0)^3=z_0   oraz  (u_*)^3=-q-z_0=\frac{-q-\sqrt{q^2+4p^3/27}}{2} (zob. drugą równość z (5)).

Zauważmy, że

(v_0)^3\cdot (u_*)^3=\frac{-q+\sqrt{q^2+4p^3/27}}{2}\cdot \frac{-q-\sqrt{q^2+4p^3/27}}{2}=\frac{q^2-q^2-4p^3/27}{4}=\frac{-p^3}{27}.

Zatem dla pewnego m\in \{0,1,2\} mamy, że

v_0\cdot u_*=-\varepsilon_m p/3.

Niech n \in \{0,1,2\} będzie takie, że \varepsilon_n\cdot \varepsilon_m=1 i połóżmy

u_0=\varepsilon_n u_*.

Wówczas liczby v_0,u_0 spełniają równania (5). Niech

y_0=v_0+u_0,   y_1=\varepsilon_1\cdot v_0+\varepsilon_1^2\cdot u_0  oraz   y_2=\varepsilon_1^2\cdot v_0+\varepsilon_1\cdot u_0.

Uzasadnienie: gdy weźmiemy \varepsilon z indeksem 1, to pomnożenie dodaje 1/3 pełnego kąta, pomnożenie przez kwadrat dodaje 2/3 pełnego kąta. Równie dobrze moglibyśmy brać \varepsilon_2 dodając 2/3 pełnego kąta i dla kwadratu 4/3 = 1/3 pełnego kąta, natomiast nie można brać \varepsilon_0 = 1.

(Powyższe wzory, po wykonaniu w nich podstawień stosownych formuł na \varepsilon_1,v_0,u_0, nazywane są wzorami Cardano. Są one współczesnym uogólnieniem metody opisanej przez Girolamo Cardano w Ars Magna.)

Wykażemy, że liczby y_0,y_1,y_2 są wszystkimi rozwiązaniami równania (2).

Zauważmy najpierw, że \varepsilon_1(1+\varepsilon_1)=-1, więc

0=0(v_0+u_0)=(1+\varepsilon_1(1+\varepsilon_1))(v_0+u_0)=(1+\varepsilon_1+\varepsilon_1^2)(v_0+u_0)=y_0+y_1+y_2.
(7)

Mamy też

y_0y_1+y_0y_2+y_1y_2=(v_0+u_0)(\varepsilon_1\cdot v_0+\varepsilon_1^2\cdot u_0)+
(v_0+u_0)(\varepsilon_1^2\cdot v_0+\varepsilon_1\cdot u_0)+(\varepsilon_1\cdot v_0+\varepsilon_1^2\cdot u_0)(\varepsilon_1^2\cdot v_0+\varepsilon_1\cdot u_0)=
(1+\varepsilon_1+\varepsilon_1^2)(v_0^2+u_0^2)+3(\varepsilon_1+\varepsilon_1^2)v_0u_0=3(\varepsilon_1+\varepsilon_1^2)v_0u_0= 3(\varepsilon_1+\varepsilon_1^2)\cdot \frac{-p}{3}=p
(8)

(przypomnijmy, że 0=1+\varepsilon_1+\varepsilon_1^2 oraz 3v_0u_0=-p; patrz (5)). Także

y_0y_1y_2=(v_0+u_0)(\varepsilon_1\cdot v_0+\varepsilon_1^2\cdot u_0)(\varepsilon_1^2\cdot v_0+\varepsilon_1\cdot u_0)=v_0^3+u_0^3+(1+\varepsilon_1+\varepsilon_1^2)v_0^2u_0+(1+\varepsilon_1+\varepsilon_1^2)v_0u_0^2=v_0^3+u_0^3=-q
(9)

(tu również korzystamy z równań (5)). Używając równań (7)-(9), otrzymujemy

(y-y_0)(y-y_1)(y-y_2)=y^3-(y_0+y_1+y_2)y^2+(y_0y_1+y_0y_2+y_1y_2)y-y_0y_1y_2=y^3+py+q.

Stąd już możemy wywnioskować, że y_0,y_1,y_2 są wszystkimi pierwiastkami równania (2).

Przykłady[edytuj | edytuj kod]

Prosty przykład[edytuj | edytuj kod]

Równanie x^3 + 5x^2 + 4x ma pierwiastki -4,-1,0.

Przechodzimy do formy y^{3}+py+q=0.. p = -4.3333, q=2.592592
z_0 = -1.2962+ 1.1547*i ma 3 pierwiastki: 0.8333+0.866*i, -1.16666+0.2886i, 0.3333-1.1547i
v_0 niech będzie pierwszym pierwiastkiem.
-q-z_0 ma trzy pierwiastki: 0.8333-0.8660i, 0.3333+1.1547, -1.166666-0.28867i
(w tym prostym przypadku pierwiastki są sprzężone, co pozwoli na eliminację części urojonej)
u_* niech będzie ostatnim pierwiastkiem
-3 \frac{v_0*u_*}{p} = -0.5 -0.866i = \varepsilon_2, stąd m=2, więc n=1
u0 = 0.8333, -0.8666
y_0 = 1.6666 y1=-2.3333 y2=0.666
I ostatecznie mamy wyniki ze wzoru x=y-\frac{b}{3a}, : x0=0, x1=-4, x2=-1

Współczynniki zespolone[edytuj | edytuj kod]

Powyższy wzór znajduje pierwiastki zespolone radząc sobie również jeżeli mamy zespolone współczynniki. Weźmy równanie

(2 + 3i)x^3 + (1 - 2i)x^2 + (-1 + 4i)x + (5 + 6i) = 0

Wynik można sprawdzić na stronie WolframAlpha.

Dla naszego równania p = 0.83431 + 0.7357·i, q = 2.09853 -0.00568·i. We wzorze na z_0 występuje pierwiastek dający dwa rozwiązania, bierzemy jedno z_0 = -0.01360 + 0.02031·i.
z_0 ma 3 pierwiastki: 0.218141 + 0.191450·i, -0.27487 + 0.0931·i, :0.05673 - 0.284641·i
Wybieramy dla v_0 pierwszy pierwiastek = 0.218141 + 0.191450·i.
-q-z_0 = -2.08492 -0.014632·i, ma trzy pierwiastki: 0.641345 - 1.1048·i, 0.636169 + 1.107854·i, -1.277515 - 0.0029885·i
Wybieramy dla u_* na przykład ostatni pierwiastek = -1.277515 - 0.0029885·i. v_0 \cdot u_* = -0.278106 - 0.245233·i jako m wybieramy 0 bo \varepsilon_0 = 1 jest odpowiednim.
A więc również n=1 bo 1*1=1; y_0 = -1.05937 + 0.188462·i, y_1 = 0.3612975 + 1.201045·i, :y_2 = 0.6980765 -1.389507·i
x_0 = -0.95681 + 0.3679495, x_1 = 0.463861 + 1.3805324, x_2 = 0.800640 -1.210020

Podsumowanie[edytuj | edytuj kod]

Aby rozwiązać równanie

ax^3+bx^2+cx+d=0
(1)

o współczynnikach zespolonych, sprowadzamy je do postaci kanonicznej

y^{3}+py+q=0,
(2)

gdzie p=\frac{c}{a}-\frac{b^{2}}{3a^{2}},\ q=\frac{2b^{3}}{27a^{3}}+\frac{d}{a}-\frac{bc}{3a^2},\ y=x+\frac{b}{3a}. Następnie znajdujemy parę liczb v_0,u_0, spełniających równania

3u_0v_0=-p   oraz   u_0^3+v_0^3=-q.

(Wymaga to rozwiązania równania kwadratowego i wyznaczenia pierwiastków trzeciego stopnia.) Rozwiązaniami równania (1) są liczby

x_0=v_0+u_0-\frac{b}{3a},
x_1= v_0\frac{-1 + i\sqrt 3}{2}-u_0\frac{1 + i\sqrt 3}{2}-\frac{b}{3a},
x_2=-v_0\frac{1 + i\sqrt 3}{2}+u_0\frac{-1 + i\sqrt 3}{2}-\frac{b}{3a}.

Pierwiastki rzeczywiste równania kanonicznego o współczynnikach rzeczywistych[edytuj | edytuj kod]

W oparciu o dyskusję w poprzedniej sekcji możemy podać gotowe wzory na pierwiastki rzeczywiste równań w postaci kanonicznej. Rozważamy następujące równanie:

y^{3}+py+q=0.
(2)

gdzie współczynniki p,qliczbami rzeczywistymi. Określmy jego wyróżnik jako

\Delta=\left(\frac{p}{3}\right)^{3}+\left(\frac{q}{2}\right)^{2}.

Zależnie od znaku wyróżnika równania mamy 3 możliwości.

Przypadek 1   \Delta>0:

Wówczas

y_1=\sqrt[3]{-\frac{q}{2}-\sqrt{\Delta}}+\sqrt[3]{-\frac{q}{2}+\sqrt{\Delta}}

jest jedynym pierwiastkiem rzeczywistym równania (2).

Przypadek 2   \Delta=0:

Wówczas równanie (2) ma co najwyżej dwa rozwiązania w liczbach rzeczywistych:

y_1=\sqrt[3]{\frac{q}{2}}  oraz  y_2=-2\sqrt[3]{\frac{q}{2}}.

Gdy q\neq 0, to rozważane równanie ma w liczbach rzeczywistych dokładnie dwa różne pierwiastki; jeden z nich jest podwójny.

Przypadek 3   \Delta<0:

W tym przypadku równanie (2) ma trzy różne pierwiastki rzeczywiste. Aby wyznaczyć i opisać te pierwiastki, używamy funkcji trygonometrycznych i postaci trygonometrycznej liczb zespolonych.

Ponieważ \Delta=\frac{q^2}{4}+\frac{p^3}{27}<0, to -\frac{p^3}{27}>\frac{q^2}{4}\geqslant 0, a stąd

\left|\frac{-\frac{q}{2}}{\sqrt{\frac{-p^3}{27}}}\right|<1.

Możemy więc zdefiniować

r=\sqrt{\frac{-p^3}{27}}>0

oraz wybrać liczbę \varphi\in (0,\pi) tak, że

\cos \varphi=\frac{-\frac{q}{2}}{\sqrt{-\frac{p^3}{27}}}.

Wówczas \Delta=-r^2\sin^2\varphi  i   -\frac{q}{2}=r\cos\varphi, a zatem liczba z=r(\cos\varphi+i\sin\varphi) spełnia równanie kwadratowe z^{2}+qz-\frac{p^{3}}{27}=0. Sprawdzamy, że sprzężone liczby zespolone

v_0=\sqrt[3]{r}(\cos\frac{\varphi}{3}+i\sin\frac{\varphi}{3})  oraz   u_0=\sqrt[3]{r}(\cos\frac{\varphi}{3}-i\sin\frac{\varphi}{3})

spełniają równania (5). Stąd, zgodnie z argumentacją z końca poprzedniej sekcji, znajdujemy, że wszystkie pierwiastki równania (2) są rzeczywiste i są to:

y_0=2\sqrt{-\frac{p}{3}}\cos\frac{\varphi}{3},
y_1=2\sqrt{-\frac{p}{3}}\cos\frac{\varphi+2\pi}{3},
y_2=2\sqrt{-\frac{p}{3}}\cos\frac{\varphi+4\pi}{3}.

Inne podejście[edytuj | edytuj kod]

Rozważamy równanie kanoniczne

y^{3}+py+q=0.
(2)

Porównując je do postaci iloczynowej

(y-y_{1})(y-y_{2})(y-y_{3})=0,

otrzymujemy nieliniowy układ równań z trzema niewiadomymi, ale o wysokiej symetrii:

y_{1}+y_{2}+y_{3}=0,
y_{1}y_{2}+y_{1}y_{3}+y_{2}y_{3}=p,
y_{1}y_{2}y_{3}=-q.

Ten nieliniowy układ z trzema niewiadomymi jest jednym z niewielu, które dają się rozwiązac analitycznie. Ponieważ równanie trzecie zawiera iloczyn trzeciego stopnia, wystarczy podstawienie para-trygonometryczne (ważony para-cosinus):

y_{2}=e^{-i\phi} \sqrt[3]{z_{2}}+ e^{i\phi} \sqrt[3]{z_{3}},
y_{3}=e^{i\phi} \sqrt[3]{z_{2}}+ e^{-i\phi} \sqrt[3]{z_{3}},

gdzie łatwo zgadnąć \phi=\pi/6, aby wyzerować inne potęgi. Dalej prowadzi to do równania kwadratowego, zapisanego prostym układem równań:

z_{2}+z_{3}=p^3,
27 z_{2} z_{3} = -q,

co daje już rozwiązanie.

Metoda obciętego szeregu Laurenta (podstawienie Viète’a)[edytuj | edytuj kod]

W równaniu kanononicznym podstawiamy

y=...+0 z^n + 0 z^{n-1} +...+ z + 0 + \frac{h}{z} +...+ \frac{0}{z^{n-1}}+\frac{0}{z^n}+...=z + 0 + \frac{h}{z}

i zawsze znajdujemy, eliminując inne potegi niż trzecia i szósta (podstawienie Viète’a),

h = - \frac{p}{3},

co prowadzi do równania kwadratowego na z^3

(z^3)^2-q z^3 -\frac{1}{27} p^3=0,

a dalej do sześciu rozwiazań na z, ale tylko trzech na y jako ze każda liczba rzeczywista lub zespolona rózna od zera ma zawsze trzy pierwiastki trzeciego stopnia.

Zobacz też[edytuj | edytuj kod]

Bibliografia[edytuj | edytuj kod]