Gry różniczkowe

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj
Niniejszy artykuł jest częścią cyklu teoria sterowania.

Klasy układów
Układy statyczne - Układy dynamiczne
Układy liniowe - Układy nieliniowe
Układy stacjonarne - Układy niestacjonarne
Układy deterministyczne - Układy stochastyczne
Układy o parametrach skupionych - Układy o parametrach rozłożonych
Układy ciągłe - Układy dyskretne


Wybrane typy regulacji
Regulacja stałowartościowa
Regulacja nadążna
Regulacja optymalna
Regulacja adaptacyjna


Metody klasyczne
Opis typu wejście-wyjście
Stabilność
Transmitancja
Charakterystyki czasowe
Regulacja PID
Charakterystyki częstotliwościowe
Linie pierwiastkowe
Korekcja fazy


Nowoczesna teoria sterowania
Równania stanu - Stan układu
Sterowalność - Przesuwanie biegunów
Regulator liniowo-kwadratowy
Obserwowalność - Obserwator stanu
Filtr Kalmana
Regulator LQG
Sterowanie predykcyjne
Krzepkość - H-nieskończoność


Inne zagadnienia
identyfikacja systemów


Dziedziny powiązane
Teoria układów dynamicznych
Przetwarzanie sygnałów
Sztuczna inteligencja
Teoria decyzji
Metody numeryczne


Perspektywa historyczna
Historia automatyki
Teoretycy sterowania

Gry różniczkowe – dział matematycznej teorii sterowania optymalnego, w którym rozpatruje się sterowanie w sytuacjach konfliktowych. Ma on także związek z teorią gier. Teoria powstała w latach pięćdziesiątych XX wieku.

Sformułowania problemów teorii gier różniczkowych[edytuj | edytuj kod]

W teorii wyróżnia się dwa rodzaje gier:

  • gra dwóch graczy,
  • gra wielu graczy.

Podstawowe wyniki uzyskano dla gier różniczkowych dwóch graczy, a sama gra podporządkowana jest wtedy następującemu schematowi:

  • dany jest pewien układ dynamiczny, w którym część sterujących działań podporządkowana jest graczowi I, a inna część graczowi II,
  • zakłada się, że dla każdego z graczy wybór działań gwarantujących mu osiągnięcie założonego celu, przy dowolnym, nieznanym wcześniej sterowaniu przeciwnika, opiera się jedynie na informacji o bieżącym stanie układu[1].

W teorii gier różniczkowych rozpatruje się także problemy, w których zakłócenia działania układu traktuje się jako działania przeciwnika.

Zazwyczaj zakłada się, że ruch sterowanego układu jest podporządkowany równaniu różniczkowemu

gdzie jest wektorem fazowym układu, i - wektorami sterowania odpowiednio graczy I i II, a czasem. Określona jest klasa strategii gracza I, a dla każdej strategii określony jest wiązką ruchów , która jest generowana przez tę strategię oraz wszystkie możliwe strategie przeciwnika. Wiązka ta wychodzi z początkowego stanu powyższego układu.

Na ruchach układu zadany jest funkcjonał nazywany płacą gry, którego wartość gracz I stara się zminimalizować. Czasem funkcjonał zależy także od realizacji sterowania obu graczy[2].

Biorąc pod uwagę także najbardziej niekorzystną realizację ruchu , gdy wybór strategii jest pozostawiony graczowi II, jakość strategii jest oceniana za pomocą wielkości:

Zadanie gracza I polega na określeniu strategii , na której realizowane jest minimum funkcjonału (jest to zadanie potęgi). Czasem rozpatruje się zadanie jakości, które polega na znalezieniu strategii spełniającej nierówność:

,

gdzie jest daną liczbą[3].

W analogiczny sposób można sformułować zadanie gracza II. Jego strategia jest oceniana przez wielkość:

Zadanie potęgi polega wtedy na znalezieniu strategii maksymalizującej wartość funkcjonału , a zadanie jakości - na znalezieniu strategii , dla której:

.

Jeśli w zadaniach graczy I i II klasy strategii i mają taką własność, że dla każdej pary uporządkowanej można określić choć jeden ruch

,

generowany przez tę parę, to oba te zadania generują grę różniczkową na klasie strategii .

Jeśli w grze różniczkowej spełniona jest równość

,

to wielkość nazywa się ceną gry różniczkowej[3].

Przykład[edytuj | edytuj kod]

Typowym przykładem gry różniczkowej jest zagadnienie pościgu-ucieczki[4]. W tej grze

,

gdzie są odpowiednio wektorami fazowymi ścigającego i uciekającego, a ich ruch opisywany jest równaniami

[3].

Najczęściej rozpatruje się przypadki, gdy wybór sterowania podlega ograniczeniom typu

,

gdzie są pewnymi zbiorami zwartymi. Płacą w takiej grze jest czas spotkania , tzn.:

,

gdzie i są wektorami utworzonymi z pierwszych współrzędnych wektorów i . Zatem zbliżenie punktów i na odległość mniejszą od jest interpretowane jako spotkanie obiektów.

Zobacz też[edytuj | edytuj kod]

Przypisy[edytuj | edytuj kod]

  1. И. М. Виноградов (redaktor): Математическая Энциклопедия. T. 2. Д-Коо. Москва: Советская Энциклопедия, 1979, s. 329. (ros.)
  2. Математическая Энциклопедия, op. cit., s. 329
  3. a b c Математическая Энциклопедия, op. cit., s. 330
  4. Elementarny przykład rozwiązania takiego problemu można znaleźć w książce: Wiktor Gutenmacher, Nikołaj Wasiliew: Proste i krzywe. Warszawa: WSiP, 1995, s. 67-70. ISBN 83-02-05275-2..