数学百科

随机控制

2023-06-08

英文

stochastic control

简介

一类控制方法.受到随机因素影响的系统即随机系统.对随机系统最常用的数学描述是随机微分方程或随机差分方程,这取决于连续时间还是离散时间.下面来看离散时间的随机系统

 xk+1=fk(xk,uk,ξk+1), (1)

 yk=gk(xk,uk-1,ηk),  (2)

xk+1是系统在k+1时刻的状态,它是k时刻的状态xk、控制uk及随机噪声ξk+1的函数.方程(1)称为状态方程.yk是k时刻的量测,当yk=xk时,系统称为完全状态信息的.但通常xk不能直接量测到,而量到的只是xk,uk-1及随机噪声ηk的函数gk(xk,uk-1,ηk).当fk和gk都是线性函数时,则系统称为线性随机系统.它的典型形式是

 xk+1=Akxk+Bkuk+Dkwk+1,(3)

 yk=Ckxk+Gkuk-1+Fkwk, (4)

其中Ak,Bk,Ck,Dk,Gk,Fk是确定性阵,wTk=[ξTk,ηTk].当{wk}是相互独立的正态序列时,系统(3),(4)称为高斯系统.这时如果(3)中的Ak,Bk,Dk依赖(y0,y1,…,yk),而(4)中的Ck,Gk,Fk依赖于(y0,y1,…,yk),那么系统(3),(4)称为条件高斯系统.

uk是k时刻的控制量,而在k时刻可用的信息只有(y0,y1,…,yk),所以uk是(y0,y1,…,yk)的函数,也就是uk是反馈控制.控制的目的是要使性能指标J(u)最小.

J(u)=ELi(xi,ui)+LN(xN), (5)

N是终端时刻,E表示数学期望.使J(u)达最小的反馈控制{uk}就是系统(1),(2),(5)或(3),(4),(5)的最优随机控制.但能得到显式表达的最优随机控制的系统只是个别情形,其中一个重要的系统就是J(u)是二次指标时的线性高斯系统(参见“LQG问题”).