时滞随机系统的微分博弈理论及应用
上QQ阅读APP看书,第一时间看更新

3.1 引言

Stackelberg策略由于在分层博弈问题中的重要应用受到了学者们的广泛关注。其中博弈的层次主要是因为领导者知道跟随者的理性行为并且事先公布自己的策略,而跟随者不知道领导者的策略,只能在给定的领导者策略下进行优化。对Stackelberg策略的研究,最早可以追溯到H.Von Stackelberg于1934年提出的Stackelberg价格领导模型[98]。在经典的古诺模型[1]和伯特兰德模型[2]里,竞争厂商在市场上的地位是平等的,因而它们的行为是相似的;而且,它们的决策是同时的。但事实上,在有些市场,竞争厂商之间的地位并不是对称的,市场地位的不对称引起了决策次序的不对称,通常,小企业先观察到大企业的行为,再决定自己的策略。德国经济学家Stackelberg建立的模型就反映了这种不对称的竞争。模型的假定是:主导企业知道跟随企业一定会对它的产量做出反应,因而当它在确定产量时,把跟随企业的反应也考虑进去了,主导企业也叫“领导者”,跟随企业也叫作“跟随者”。

Stackelberg价格领导模型刚提出来的时候并没有受到太多的重视,可能是由于西方经济追求的是自由竞争。现在已经开始受到越来越多的关注,理论成果不断丰富,最新的研究成果包括Bensoussan等[99,100]、Mukaidani和Xu[101]。针对领导者策略具有后效性的博弈问题,据我们所知,目前还没有相关结果。

本章主要研究时滞线性系统的Stackelberg博弈问题。主要思路是从无时滞情形出发,找到研究方法,进一步解决领导者的策略具有后效性的问题。对无时滞情形,通过求解一组正倒向随机微分方程(Forward-Backward Stochastic Differential Equation,FBSDE)得出开环Stackelberg策略存在且唯一的充要条件。然后,基于求解该FBSDE得到均衡解的显式表达。进一步,将同样的思路应用到领导者策略具有后效性的情形,通过求解一个推广的FBSDE得出开环Stackelberg策略存在的充要条件以及显式最优策略。