Gry różniczkowe

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania
Niniejszy artykuł jest częścią cyklu teoria sterowania.

Klasy układów
Układy statyczne - Układy dynamiczne
Układy liniowe - Układy nieliniowe
Układy stacjonarne - Układy niestacjonarne
Układy deterministyczne - Układy stochastyczne
Układy o parametrach skupionych - Układy o parametrach rozłożonych
Układy ciągłe - Układy dyskretne


Wybrane typy regulacji
Regulacja stałowartościowa
Regulacja nadążna
Regulacja optymalna
Regulacja adaptacyjna


Metody klasyczne
Opis typu wejście-wyjście
Stabilność
Transmitancja
Charakterystyki czasowe
Regulacja PID
Charakterystyki częstotliwościowe
Linie pierwiastkowe
Korekcja fazy


Nowoczesna teoria sterowania
Równania stanu - Stan układu
Sterowalność - Przesuwanie biegunów
Regulator liniowo-kwadratowy
Obserwowalność - Obserwator stanu
Filtr Kalmana
Regulator LQG
Sterowanie predykcyjne
Krzepkość - H-nieskończoność


Inne zagadnienia
identyfikacja systemów


Dziedziny powiązane
Teoria układów dynamicznych
Przetwarzanie sygnałów
Sztuczna inteligencja
Teoria decyzji
Metody numeryczne


Perspektywa historyczna
Historia automatyki
Teoretycy sterowania

Gry różniczkowe – dział matematycznej teorii sterowania optymalnego, w którym rozpatruje się sterowanie w sytuacjach konfliktowych. Ma on także związek z teorią gier. Teoria powstała w latach pięćdziesiątych XX wieku.

Sformułowania problemów teorii gier różniczkowych[edytuj | edytuj kod]

W teorii wyróżnia się dwa rodzaje gier:

  • gra dwóch graczy,
  • gra wielu graczy.

Podstawowe wyniki uzyskano dla gier różniczkowych dwóch graczy, a sama gra podporządkowana jest wtedy następującemu schematowi:

  • dany jest pewien układ dynamiczny, w którym część sterujących działań podporządkowana jest graczowi I, a inna część graczowi II,
  • zakłada się, że dla każdego z graczy wybór działań gwarantujących mu osiągnięcie założonego celu, przy dowolnym, nieznanym wcześniej sterowaniu przeciwnika, opiera się jedynie na informacji o bieżącym stanie układu[1].

W teorii gier różniczkowych rozpatruje się także problemy, w których zakłócenia działania układu traktuje się jako działania przeciwnika.

Zazwyczaj zakłada się, że ruch sterowanego układu jest podporządkowany równaniu różniczkowemu

\dot{x} = f(t, x, u, v)

gdzie x\; jest wektorem fazowym układu, u\; i v\; - wektorami sterowania odpowiednio graczy I i II, a t\; czasem. Określona jest klasa strategii \mathcal{U} gracza I, a dla każdej strategii U \in \mathcal{U} określony jest wiązką ruchów X(U), która jest generowana przez tę strategię oraz wszystkie możliwe strategie przeciwnika. Wiązka ta wychodzi z początkowego stanu powyższego układu.

Na ruchach x(t), t \geqslant t_0 układu zadany jest funkcjonał \gamma(x(\cdot)) nazywany płacą gry, którego wartość gracz I stara się zminimalizować. Czasem funkcjonał \gamma zależy także od realizacji u(t), v(t), t \geqslant t_0 sterowania obu graczy[2].

Biorąc pod uwagę także najbardziej niekorzystną realizację ruchu x(\cdot) \in X(U), gdy wybór strategii jest pozostawiony graczowi II, jakość strategii U \in \mathcal{U} jest oceniana za pomocą wielkości:

\kappa_1(U) = \sup \{\gamma(x(\cdot)): x(\cdot) \in X(U)\}.

Zadanie gracza I polega na określeniu strategii U_0 \in \mathcal{U}, na której realizowane jest minimum funkcjonału \kappa_1 (jest to zadanie potęgi). Czasem rozpatruje się zadanie jakości, które polega na znalezieniu strategii U_c \in \mathcal{U} spełniającej nierówność:

\kappa_1(U_c) \leqslant c,

gdzie c\; jest daną liczbą[3].

W analogiczny sposób można sformułować zadanie gracza II. Jego strategia V \in \mathcal{V} jest oceniana przez wielkość:

\kappa_2(V) = \sup \{\gamma(x(\cdot)): x(\cdot) \in X(V)\}.

Zadanie potęgi polega wtedy na znalezieniu strategii maksymalizującej wartość funkcjonału \kappa_2, a zadanie jakości - na znalezieniu strategii V_c \in \mathcal{V}, dla której:

\kappa_2(V_c) \geqslant c.

Jeśli w zadaniach graczy I i II klasy strategii \mathcal{U} i \mathcal{V} mają taką własność, że dla każdej pary uporządkowanej (U, V) \in \mathcal{U} \times \mathcal{V} można określić choć jeden ruch

x(\cdot) \in X(U) \cap X(V),

generowany przez tę parę, to oba te zadania generują grę różniczkową na klasie strategii \mathcal{U} \times \mathcal{V}.

Jeśli w grze różniczkowej spełniona jest równość

\inf_{U \in \mathcal U}\,\, \sup_{x(\cdot) \in X(U)} \gamma(x(\cdot)) = \sup_{V \in \mathcal V}\,\, \inf_{x(\cdot) \in X(V)} \gamma(x(\cdot)) = c_0,

to wielkość c_0 nazywa się ceną gry różniczkowej[4].

Przykład[edytuj | edytuj kod]

Typowym przykładem gry różniczkowej jest zagadnienie pościgu-ucieczki[5]. W tej grze

x = (x_1, \ldots, x_{k + l}) = (y_1, \ldots, y_k, z_1, \ldots, z_l) ,

gdzie y = (y_1, \ldots, y_k), z = (z_1, \ldots, z_l) są odpowiednio wektorami fazowymi ścigającego i uciekającego, a ich ruch opisywany jest równaniami

\dot{y} = g(t, y, u), \dot{z} = h(t, z, v)[6].

Najczęściej rozpatruje się przypadki, gdy wybór sterowania podlega ograniczeniom typu

u \in P, v \in Q,

gdzie P, Q są pewnymi zbiorami zwartymi. Płacą w takiej grze jest czas spotkania , tzn.:

\gamma(x(\cdot)) = T(x(\cdot)) = \inf \{t - t_0: ||\{y(t)\}_m - \{z(t)\}_m|| \leqslant \varepsilon\},

gdzie \{y(t)\}_m i \{z(t)\}_m są wektorami utworzonymi z pierwszych m\; współrzędnych wektorów y\; i z\;. Zatem zbliżenie punktów \{y(t)\}_m i \{z(t)\}_m na odległość mniejszą od \varepsilon jest interpretowane jako spotkanie obiektów.

Zobacz też[edytuj | edytuj kod]

Przypisy

  1. И. М. Виноградов (redaktor): Математическая Энциклопедия. T. 2. Д-Коо. Москва: Советская Энциклопедия, 1979, s. 329. (ros.)
  2. Математическая Энциклопедия, op. cit., s. 329
  3. Математическая Энциклопедия, op. cit., s. 330
  4. Математическая Энциклопедия, op. cit., s. 330
  5. Elementarny przykład rozwiązania takiego problemu można znaleźć w książce: Wiktor Gutenmacher, Nikołaj Wasiliew: Proste i krzywe. Warszawa: WSiP, 1995, s. 67-70. ISBN 83-02-05275-2..
  6. Математическая Энциклопедия, op. cit., s. 330