2/10 MITの安定化制御則(1)

[1]では, MITが開発したAtlasを用いた安定化制御について解説している.
Atlasの安定化制御については[2],[3].
これらの文献を参考にHumの安定化制御則を考えていく.
まず, 全体的な流れを下図に示す[2].

ここで添え字refはreferenceの略であり, 基準や参照といった意味を持つ.
図中のLQRは, 下式で表される最適制御則である.
・・・(1)
\(^*u\)は, 下式のハミルトン・ヤコビ・ベルマン方程式を解くことで得られた時間関数\(u=u(t)\)の値である.
・・・(2)
式中の\(V\)(x,\(t\))は, 状態x, 時刻\(t\)が初期値として与えられたとき, 下式で設定される評価関数\(J\)の最小値として定義され, cost-to-go関数, または価値関数と呼ばれる[4].
・・・(3)
すなわち,
・・・(4)
ところで, 式(1)の状態フィードバックゲインK1およびフィードフォワード項k2(t)はそれぞれS1 , s2より計算される. S1 , s2 には, それぞれに対応するリッカチの方程式(大学初年度で習う)が存在し, これを計算することで具体的な値が求まる. s2はLQRブロックから出力される. 式(1)~(4)の詳細は[1].
明日2/11は文献[2][3]の要点を見ていき, 上の制御の流れの詳細にも触れていく.

 

【参考文献】
[1]https://www.jstage.jst.go.jp/article/jrsj/36/2/36_36_140/_pdf
[2]https://dspace.mit.edu/openaccess-disseminate/1721.1/110533
[3]http://scottk.seas.harvard.edu/files/scottk/files/explicit-zmp.pdf
[4]https://bicr.atr.jp/bri/wp-content/uploads/2018/06/623f9de6becedf74fcdc9c0ecb829c5b.pdf