Dekompozycja Kalmana

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Dekompozycja Kalmana - termin używany w teorii sterowania na określenie konwersji realizacji stacjonarnego liniowego układu regulacji do postaci, w której układ ujawnia części obserowalną i sterowalną co pozwala na wyciągnięcie wniosków odnośnie osiagalnych i obserwowalnych podprzestrzeni dla danego układu.

Notacja[edytuj | edytuj kod]

Wyprowadzenie przebiega tak samo zarówno dla (stacjonarnych) układów czasu ciągłego jak i układów dyskretnych. Niech dany będzie liniowy, stacjonarny układ ciągły opisany równaniami stanu:

\dot{x}(t) = Ax(t) + Bu(t)
\, y(t) = Cx(t) + Du(t)

Układ taki można opisać za pomocą krotki czterech macierzy \, (A, B, C, D). Niech rząd systemu wynosi \, n. Wówczas dekompozycja Kalmana zdefiniowana jest jako transformacja krotki \, (A, B, C, D) do postaci \, (\hat{A}, \hat{B}, \hat{C}, \hat{D}) w następujący sposób:

\, {\hat{A}} = {T^{-1}}AT
\, {\hat{B}} = {T^{-1}}B
\, {\hat{C}} = CT
\, {\hat{D}} = D

\, T jest macierzą odwrotną o rozmiarach \, n \times n zdefiniowaną jako:

\,  T = \begin{bmatrix} T_{r\overline{o}} & T_{ro} & T_{\overline{ro}} & T_{\overline{r}o}\end{bmatrix}

gdzie

  • \, T_{r\overline{o}} to macierz, której kolumny rozpięte są w podprzestrzeni stanów, które są zarówno osiągalne jak i nieobserwowalne.
  • \, T_{ro} jest tak dobrana, że kolumny \, \begin{bmatrix} T_{r\overline{o}} & T_{ro}\end{bmatrix} stanowią bazę dla podprzestrzeni osiągalnej.
  • \, T_{\overline{ro}} jest tak dobrana, że kolumny \, \begin{bmatrix} T_{r\overline{o}} & T_{\overline{ro}}\end{bmatrix} stanowią bazę dla podprzestrzeni nieobserwowalnej.
  • \, T_{\overline{r}o} jest tak dobrana, że macierz \,\begin{bmatrix} T_{r\overline{o}} & T_{ro} & T_{\overline{ro}} & T_{\overline{r}o}\end{bmatrix} jest odwrotna.

W takiej konstrukcji macierz \, T jest odwrotna. Można zauważyć , że niektóre z tych macierzy mogą mieć wymiar równy zero. Na przykład, jeśli system jest zarówno obserwowalny jak i sterowalny wówczas \, T = T_{ro} co sprawia, że inne macierze mają wymiar zerowy.

Forma standardowa[edytuj | edytuj kod]

Korzystając z wyników dla sterowalności i obserwowalności można pokazać, że układ po transformacji \, (\hat{A}, \hat{B}, \hat{C}, \hat{D}) ma macierze o następującej postaci:

\, \hat{A} = \begin{bmatrix}A_{r\overline{o}} & A_{12} & A_{13} & A_{14} \\
0 & A_{ro} & 0 & A_{24} \\
0 & 0 & A_{\overline{ro}} & A_{34}\\
0 & 0 & 0 & A_{\overline{r}o}\end{bmatrix}
\, \hat{B} = \begin{bmatrix}B_{r\overline{o}} \\ B_{ro} \\ 0 \\ 0\end{bmatrix}
\, \hat{C} = \begin{bmatrix}0 & C_{ro} & 0 & C_{\overline{r}o}\end{bmatrix}
\, \hat{D} = D

Prowadzi to do wniosku, że

  • Podukład \, (A_{ro}, B_{ro}, C_{ro}, D) jest zarówno osiągalny jak i obserwowalny.
  • Podukład \, \left(\begin{bmatrix}A_{r\overline{o}} & A_{12}\\ 0 & A_{ro}\end{bmatrix},\begin{bmatrix}B_{r\overline{o}} \\ B_{ro}\end{bmatrix},\begin{bmatrix}0 & C_{ro}\end{bmatrix}, D\right) jest osiągalny.
  • Podukład \, \left(\begin{bmatrix}A_{ro} & A_{24}\\ 0 & A_{\overline{r}o}\end{bmatrix},\begin{bmatrix}B_{ro} \\ 0 \end{bmatrix},\begin{bmatrix}C_{ro} & C_{\overline{r}o}\end{bmatrix}, D\right) jest obserwowalny.