时滞随机系统的微分博弈理论及应用
上QQ阅读APP看书,第一时间看更新

1.1 研究背景与意义

从系统理论的观点看,任何实际系统的过去状态不可避免地要对当前的状态产生影响,即系统的演化趋势不仅依赖于系统当前的状态,也依赖于过去某一时刻或若干时刻的状态,这类系统称为时滞系统,有时也称为泛函微分系统,英文文献中多称为Time-Delay Systems或Systems with Aftereffect。21世纪以来,许多学科中提出了大量的时滞系统问题,如电路信号系统、核物理学、生态系统、遗传问题、化工循环系统、流行病学、动物与植物的循环系统。社会科学方面主要是各种经济时滞现象的描述,如产品营销问题、国民财富分配理论、资本主义周期性经济危机、物流调度、工业管理等等。因此研究时滞系统,或者说是泛函微分系统就有了其深刻的理论和实际意义。

作者在完成国家自然科学基金和广东省自然科学基金的过程中,获得了确定性动态系统和随机系统微分博弈理论的部分结果,同时在研究线性Markov切换系统动态经济模型结构特征与控制时,发现像期权定价、多部门动态投入产出模型这样的实际经济系统模型,借助时滞随机系统模型来描述更能准确反映经济系统的动态特性。同时,鉴于微分博弈理论具有广阔的应用前景,特提出本书的研究内容,希望借此完成如下科学问题的研究。

科学问题:

正常随机线性系统的微分博弈理论时滞随机系统的微分博弈理论。

亦即本书研究的科学问题是:式(1.1)描述的状态和控制均存在时滞的随机系统的微分博弈理论。

其中wt是定义在完备概率空间(Ω,F,{Ft}0≤t∈TP)上的d-维标准布朗运动,为给定函数;ui(·)是取值于UiFt-可测的控制变量,表示博弈人i的决策控制变量,为非空凸集,i=1,2;τ>0为给定的有限的时间延迟,φt、ξt和ηt为确定性函数,满足

Ji[u1(·),u2(·)]表示博弈人i∈{1,2}的性能指标泛函:

其中ΦiRnRi=1,2为给定的函数。

所谓的微分博弈问题是:博弈人i∈{1,2}如何在满足状态方程(1.1)的约束条件下选择自己的决策控制变量ui(·),使各自的性能指标函数Ji[u1(·),u2(·)]达到最优[1]

显然,如果只有一个博弈人(即单人博弈),则博弈问题退化为时滞随机系统的最优控制问题,即在如下状态方程

的约束下,寻找最优控制策略u1*(·),使性能指标泛函J[u1(·)]达到最优。因此,时滞随机系统的最优控制理论是时滞随机系统微分博弈理论的特例。

而当τ=0,即系统中的状态变量和控制变量不存在时滞时,式(1.1)退化为一般意义下的Itô随机系统,即

因此,从这个意义来说,Itô随机系统的微分博弈理论是时滞随机系统微分博弈理论的特例,时滞随机系统是Itô随机系统的自然推广。

而当σ(·,·,·,·,·,·)=0时,式(1.1)变为下述确定性(deterministic)时滞系统

显然,时滞随机系统(1.1)可以看作是deterministic时滞系统(1.4)的推广,相当于在系统(1.4)中加了随机扰动项σ(·,·,·,·,·,·)dwt。因此,deterministic时滞系统微分博弈理论是时滞随机系统微分博弈理论的特例。

因此,本书的研究既有继承又有创新发展,是有理论意义的。

同时,时滞随机系统微分博弈理论还有重要的实际应用价值,下面从本书拟研究问题的科学需求、社会经济需求两个方面进一步分析本选题的依据和意义。社会经济需求是指对该学科有所依赖的社会经济问题的需求;科学需求是指学科自身知识体系完善的内在需求[2](如图1.1所示)。

图1.1 研究问题的科学发展需求分析两维体系

1.社会经济需求分析

(1)所依赖的社会经济问题之一:多部门动态投入产出分析模型。1965年,Leontief提出了离散的动态投入产出模型[3]

其中Xk)=[x1k),x2k),…xnk)]T,而xik)是第i部门第k年总产出量;yk)是第k年最终消费量(不包括投资)向量;A是生产系数矩阵;B是投资系数矩阵。模型(1.5)的提出依赖于两个假设:①各部门从投资开始到投产没有时间上的延迟,二者同时开始;②投资是一次性的,即所有投资产品,包括建筑工程、机器设备、流动资金等在工程开始时同时投入,没有时间上的先后之分。这与实际经济活动显然是不相符的。为此,必须研究考虑时滞效应下的投入产出模型,何堃研究了规划期为m年,具有多年时滞因素的投入产出模型[4]

其中z表示所有投资产品中最大的时滞数;Bk+ll)为第k年,时滞为l年(lz)的投资产品的n阶投资系数矩阵。模型(1.6)即为含时滞的动态投入产出模型,它能较准确地刻画国家(或地区、部门)经济的生产、积累和消耗之间的关系,因而可以更好地进行经济预测和制定中长期规划。

此外,付雪和陈锡康综合考虑了人力资本和物资资本具有多年时滞的特点,建立了多年时滞教育经济投入占用产出模型和人力资本投入产出模型[5,6]

因此,通过本书的研究可以分析当投资品投入与产出具有时滞时,各部门的最优投资均衡策略(鞍点均衡、Nash均衡等),为动态投入产出分析提供新理论和新方法。

(2)所依赖的社会经济问题之二:金融工程的期权定价问题、资本投资和保险定价等问题[7~14]。20世纪70年代早期,Black和Scholes利用几何布朗运动wt)模拟期权标的风险资产在t时刻的价格St),即

其中μσ为给定常数,分别表示风险资产的预期收益率和波动率,wt)为一维标准布朗运动,反映金融市场的变化。尽管Black和Scholes利用式(1.7)给出了几乎完美的期权定价公式,但大量实践表明使用Black-Scholes公式并不能精确预测期权价格,这也促使许多学者对该模型进行改进,其中一种改进就是建立动态模型来考虑过去的事件对现在和将来的影响,即假设期权的价格不仅仅与当前的信息有关,过去的信息也应当会影响到期权的价格。于是,期权标的风险资产的价格St)可以用一个时滞随机微分方程(Stochastic Delay Differential Equation)来描述:

其中μab为正常数,δ=maxabg:R→R是一个连续函数,φt)为确定性实值函数。目前已有部分学者利用随机分析的方法讨论模型(1.8),如Anh和Inoue、Kazmerchuka等考虑了股票价格在扩散项具有时滞的期权定价[10~12],Arriojas等、Chang和Youree研究了股票价格在漂移项和扩散项都具有时滞情形下的期权定价[7,13]。但是,他们在分析处理该问题时都会遇到一个困难:要给出由模型(1.8)所衍生出的各种形式的定价偏微分方程的解,这无疑增加了分析问题的难度。

作者认为,为了避免求解时滞随机系统(1.8)所衍生出的各种偏微分方程的困难,应将期权定价过程视为一个博弈过程,博弈人1为定价者,其决策控制变量为其投资策略;博弈人2即拟人化的风险市场随机干扰“代理人”,该“代理人”的决策控制变量为描述随机扰动的布朗运动过程w(·)。而时滞随机系统(1.8)所表示的正好是博弈双方的状态演化过程。这样就可以利用时滞随机系统的非合作微分博弈理论进行研究。比如:若在上述模型(1.8)中假设ut)和Vt)分别表示在t时刻持有某标的资产的价值和投资者的财富,则期权套期保值问题就是:如何在博弈人2(市场干扰“代理人”)的最大随机波动干扰下,寻找自融资证券组合套期保值策略u(·),使终期证券组合的价值VT)尽可能接近期权的到期支付F[ST)][7]。因此,它是一个典型的时滞随机系统的鞍点均衡策略问题。研究表明:投资消费和保险定价问题也可以在一定条件下转化为时滞随机系统鲁棒控制问题[8,9,14]。因此,社会经济的实际问题研究需要用时滞随机系统微分博弈理论。

(3)所依赖的社会经济问题之三:广告模型(Advertising models)。基于数学模型的最优广告投入的研究始于1957年Vidale和Wolfe提出的广告销售反应模型(VW模型)[15]和1962年Nerlove和Arrow提出的广告的资本股模型(NA模型)[16],经过50多年的发展,这方面研究已取得了丰硕的成果,并且有些已成为企业确定最优广告投入的依据。但实证研究表明这些成果与经验数据项的符合程度不尽人意。为此部分学者考虑了广告支出与商誉资本增值之间存在时间滞后情形下的最优广告投入问题,典型的工作见Gozzi和Marinelli等[17,18]。他们的研究考虑了单个商品的广告模型,设ys),0≤sT表示商誉水平,z表示广告支出,则有

其中w(·)是定义在完备概率空间上的布朗运动,a0≤0是一个常数值的衰减系数,b0≥0是一个常数值的广告效果因子,a1(·)表示遗忘时间的分布函数,b1(·)表示商誉水平y(·)和广告支出z(·)之间时间滞后的密度函数,η0表示广告开始时的商誉水平,η(·)和δ(·)分别表示商誉水平和广告支出在零时刻以前的历史值。注意到当a1(·),b1(·)和σ都等于0时,方程(1.9)就退化为经典的NA模型。对于经典的NA模型,已有部分学者利用微分博弈的方法来研究并成功运用到市场实践中(见参考文献[19~21]及其所引文献)。据作者搜集查阅的文献资料所知,对于考虑时滞效应下的广告模型,利用最优控制来进行研究的成果已经出现,利用微分博弈来进行研究的还未见报道,而在微分博弈的理论框架下研究广告模型能揭示出一般模型表示中可能遗漏的重要结论,进而使得很多在经典最优控制框架下难以圆满解释的问题,在微分博弈的理论框架下可以得到更加系统、客观的回答[19]。因而通过本书的研究,能够为广告模型提供更加贴近现实的结果,从而为企业决策提供更为精确的依据。

(4)所依赖的社会经济问题之四:鲁棒控制问题。针对式(1.1)所描述的时滞随机系统的鲁棒控制问题,基于博弈论方法设计鲁棒控制器的基本思想是:将控制策略设计者视为博弈的一方即博弈人1,将随机性(或不确定性)干扰视为博弈的另一方即拟人化的“干扰代理人”,从而将鲁棒控制问题转化为两人博弈问题,即博弈人1如何在预期到“干扰代理人”的各种干扰策略情况下设计自己的策略,既实现与“干扰代理人”的均衡又使自己的目标最优。通过将不同性能要求的鲁棒控制问题转化为各种类型的鞍点均衡问题或Nash均衡问题,再由微分博弈理论的鞍点均衡策略或Nash均衡策略即可得到鲁棒控制策略。这种用博弈论方法研究鲁棒控制问题的思路已经在确定系统的鲁棒控制研究中取得了巨大成功,如Limebeer等分别给出了线性时变系统的H鲁棒控制、混合H2/H鲁棒控制器设计的博弈论方法[22,23];台湾清华大学的陈博现(Chen Bor-Sen)教授和山东科技大学的张维海(Zhang Weihai)教授用博弈论方法首次将确定系统的混合H2/H控制问题的结果推广到噪声依赖状态的随机系统中,证明了有限(无限)时域随机H2/H控制的存在性等价于一个耦合的广义微分(代数)Riccati方程的可解性[24];Huang等利用博弈论的方法将噪声依赖于状态的线性随机系统的混合H2/H控制推广到带Markov跳变参数的线性随机系统混合H2/H控制上[25];笔者也在系统研究线性Markov切换系统随机微分博弈的基础上,利用相关结果研究了线性Markov切换系统的H鲁棒控制、混合H2/H鲁棒控制问题[26~29]。但就笔者所查到的资料而言,用博弈论方法研究时滞随机系统各种性能鲁棒控制的结果较少且还不完善。因此作者确信,只要研究出一套完整的时滞随机系统微分博弈理论,就有可能获得时滞随机系统鲁棒控制问题的新方法、新结果。

1.科学需求分析

(1)从正常随机系统到时滞随机系统的内在需求分析:虽然爱因斯坦(A.Einstein)、柯尔莫戈洛夫(A.N.Kolmogorov)、维纳(N.Wiener)和伊藤清(K.Itô)等科学家建立的随机系统的相关理论已经能较好地描述现实世界中的许多系统,但更现实的情况是众多实际系统的状态或多或少都与系统的历史相关,或者说系统的历史会影响其现状和将来的发展,这些现象称为时滞现象。时滞现象大量存在于自然科学与社会科学中,如通信系统[30]、神经网络[31,32]、生物和人口系统[33,34]、经济金融[35]、化工循环系统[36]、城市交通管理系统和工业生产管理等[37]。为了准确地刻画这些系统的动态特性,需要用时滞随机系统来描述。目前有关随机系统的非合作博弈理论已经取得了丰富的研究成果,而且成功用于研究随机系统的鲁棒控制问题,因此需要研究时滞随机系统的微分博弈理论。

(2)从博弈理论自身知识体系完善性的内在需求分析:随机系统的非合作博弈理论,已经有了较系统的理论体系,而对时滞随机系统的非合作博弈理论,学者们的研究相对较少,仅日本广岛大学的Mukaidani教授等研究了状态时滞的随机线性系统和随机弱耦合线性系统的Nash均衡存在的条件,利用线性矩阵不等式(LMI)技术给出了均衡策略的状态反馈解[38~40],但工程实际中存在着大量控制时滞的随机系统。因此,从博弈理论自身知识体系完善性的内在需求出发,需要对时滞随机系统的微分博弈理论进行系统研究。

目前国内外学者已经在时滞随机系统的最优控制问题(即单人博弈问题)等方面展开了广泛研究并取得了丰富成果[41~45,50~57]。因此,研究时滞随机系统的微分博弈理论是必要的也是可行的,同时也是有理论意义和现实应用价值的。