Metoda gradientu prostego

Metoda gradientu prostego – algorytm numeryczny mający na celu znalezienie minimum lokalnego zadanej funkcji celu.

Jest to jedna z prostszych metod optymalizacji. Przykładami innych metod są metoda najszybszego spadku, czy metoda Newtona.

Algorytm[edytuj | edytuj kod]

Zadanie[edytuj | edytuj kod]

Metoda gradientu prostego jest iteracyjnym algorytmem wyszukiwania minimum zadanej funkcji celu $f{:}$

f\colon D\mapsto \mathbb {R} ,

gdzie $D\subset \mathbb {R} ^{n}.$

Założenia dla metody są następujące:

$f\in \mathrm {C} ^{1}$ (funkcja jest ciągła i różniczkowalna),
$f$ jest ściśle wypukła w badanej dziedzinie.

Na samym początku algorytmu wybierany jest punkt startowy $\mathbf {x_{0}} \in D.$ W punkcie tym obliczany jest kierunek poszukiwań $\mathbf {d_{k}} \in D.$ Punkt w następnym kroku obliczany jest według wzoru:

\mathbf {x_{k+1}} =\mathbf {x_{k}} +\alpha _{k}\mathbf {d_{k}} ,

jeśli obliczony punkt nie spełni warunku stopu algorytmu, całe postępowanie jest powtarzane.

Kierunkiem poszukiwań w metodzie gradientu prostego jest antygradient funkcji celu $-\nabla f(\mathbf {x_{k}} ).$

Współczynnik $\alpha _{k}$ jest współczynnikiem długości kolejnych kroków. W wielu przypadkach przyjmuje się stałe niewielkie wartości:

\alpha _{k}=\alpha ={\textrm {const}}.

Jeśli $f$ jest funkcją kwadratową o dodatnio określonym hesjanie $H$ to można przyjąć:

0<\alpha <{\frac {1}{\lambda }}.

gdzie $\lambda$ jest największą wartością własną macierzy $H.$

Współczynnik $\alpha _{k}$ może również dynamicznie zmieniać się podczas procesu szukania minimum. Kolejne kroki w algorytmie powinny być wybierane tak aby:

f(\mathbf {x_{0}} )>\dots >f(\mathbf {x_{k}} )>f(\mathbf {x_{k+1}} ).

Jeżeli warunek ten nie jest w danym kroku spełniony, to należy powtórzyć krok z mniejszą wartością $\alpha _{k}.$

Algorytm ogólnie można zapisać:

Wybierz punkt startowy $\mathbf {x_{0}} .$
$\mathbf {x_{k+1}} =\mathbf {x_{k}} -\alpha _{k}\nabla f(\mathbf {x_{k}} ).$
Sprawdź kryterium stopu, jeśli jest spełniony to STOP.
Jeżeli $f(\mathbf {x_{k+1}} )\geqslant f(\mathbf {x_{k}} )$ to zmniejsz wartość $\alpha _{k}$ i powtórz punkt 2 dla kroku $k$ -tego.
Powtórz punkt 2 dla następnego kroku $(k+1).$

Kryterium stopu[edytuj | edytuj kod]

W celu określenia, czy punkt w danym kroku dostatecznie dobrze przybliża minimum funkcji celu w metodzie gradientu prostego, można użyć następujących kryteriów stopu (dla zadanej precyzji $\epsilon$ oraz normy $\|{\cdot }\|$ ):

\|\nabla f(\mathbf {x_{k}} )\|\leqslant \epsilon ,\quad {}

(test stacjonarności)

\|\mathbf {x_{k+1}} -\mathbf {x_{k}} \|\leqslant \epsilon .

Zbieżność[edytuj | edytuj kod]

Metoda gradientu prostego jest metodą o zbieżności liniowej. Oznacza to, iż przy spełnieniu założeń metody, odległości pomiędzy kolejnymi przybliżeniami a minimum funkcji $\mathbf {x} ^{*}$ maleją liniowo:

\|\mathbf {x} ^{*}-\mathbf {x_{k+1}} \|\leqslant c\|\mathbf {x} ^{*}-\mathbf {x_{k}} \|.

Przykład[edytuj | edytuj kod]

Na poniższych rysunkach zilustrowane zostały kolejne kroki metody gradientu prostego dla funkcji:

F(x,y)=\sin \left({\frac {1}{2}}x^{2}-{\frac {1}{4}}y^{2}+3\right)\cos(2x+1-e^{y}).

Zobacz też[edytuj | edytuj kod]

Bibliografia[edytuj | edytuj kod]

Fortuna Z., Macukow B., Wąsowski J.: Metody numeryczne, Wydawnictwa Naukowo-Techniczne, 2006.* Stachurski A., Wierzbicki A.: Podstawy optymalizacji, Oficyna Wydawnicza Politechniki Warszawskiej, 1999.

Linki zewnętrzne[edytuj | edytuj kod]

https://web.archive.org/web/20170815181749/http://www.isep.pw.edu.pl/~ambor/Pomoce/gradientowe.htm