[论文解读] Time-Inconsistent Stochastic Linear--Quadratic Control
本文将一个具有状态期望项和状态相关项的一般时变不一致随机线性二次(LQ)控制问题形式化,通过开环策略定义均衡控制。利用前向-后向随机微分方程(FBSDE)族推导出均衡的充分条件,并在标量确定性情形下获得显式均衡控制,将该框架应用于随机市场参数下的均值-方差投资组合选择问题。
In this paper, we formulate a general time-inconsistent stochastic linear--quadratic (LQ) control problem. The time-inconsistency arises from the presence of a quadratic term of the expected state as well as a state-dependent term in the objective functional. We define an equilibrium, instead of optimal, solution within the class of open-loop controls, and derive a sufficient condition for equilibrium controls via a flow of forward--backward stochastic differential equations. When the state is one dimensional and the coefficients in the problem are all deterministic, we find an explicit equilibrium control. As an application, we then consider a mean-variance portfolio selection model in a complete financial market where the risk-free rate is a deterministic function of time but all the other market parameters are possibly stochastic processes. Applying the general sufficient condition, we obtain explicit equilibrium strategies when the risk premium is both deterministic and stochastic.
研究动机与目标
- 解决由于非期望效用项导致标准动态规划失效的时变不一致随机LQ控制问题。
- 在更广泛的开环控制类中定义均衡控制,而非像以往研究那样局限于反馈控制。
- 通过前向-后向随机微分方程(FBSDE)族推导出均衡的一般充分条件。
- 将均衡策略扩展至随机市场参数下的均值-方差投资组合选择,其中现有HJB方法失效。
- 表明开环均衡定义与反馈控制定义所得策略不同,凸显建模方式选择的重要性。
提出的方法
- 在目标泛函中引入二次期望项和状态相关项,形式化一个一般时变不一致随机LQ控制问题。
- 通过博弈论视角定义均衡控制,即在任何时刻均无偏离控制的动机。
- 利用随时间演化的前向-后向随机微分方程(FBSDE)系统推导出均衡的充分条件,形成时间流。
- 在标量确定性系数情形下,将FBSDE系统约化为Riccati型常微分方程(ODE),从而获得显式均衡控制。
- 将一般框架应用于连续时间均值-方差投资组合选择问题,其中风险溢价为随机,显式求解FBSDE。
- 与以往基于反馈控制的方法进行比较,表明由于均衡定义不同,所得均衡策略存在差异。
实验结果
研究问题
- RQ1如何重新表述时变不一致随机LQ控制问题,以允许动态均衡解,而非预承诺最优控制?
- RQ2开环控制在定义均衡策略中起什么作用?在时变不一致设定下,其与反馈均衡有何不同?
- RQ3能否通过形成时间参数化流的前向-后向随机微分方程(FBSDE)推导出均衡的一般充分条件?
- RQ4随机市场参数(如随机风险溢价)如何影响均值-方差模型中均衡投资组合策略的结构?
- RQ5在随机参数下,均值-方差投资组合选择中,开环与反馈控制均衡策略的定量差异是什么?
主要发现
- 本文通过前向-后向随机微分方程(FBSDE)族,推导出时变不一致随机LQ问题中均衡控制的一般充分条件。
- 在标量确定性系数情形下,均衡控制被显式推导为线性反馈形式,FBSDE系统被约化为Riccati型ODE。
- 对于确定性风险溢价下的均值-方差投资组合选择,当反馈分量缺失时,所推导的均衡策略与以往反馈控制框架的结果一致。
- 当风险溢价为随机时,本文首次在开环框架下提供了显式均衡策略,其与反馈控制结果不同,原因在于均衡定义的差异。
- 在随机风险溢价情形下,均衡策略由两部分组成:一部分类似于确定性情形下的对应策略,另一部分则用于对冲市场风险价格的随机性。
- 结果表明,均衡定义的选择——开环与反馈——即使在确定性情形下,也会导致根本不同的策略,凸显建模方式在时变不一致控制中的关键作用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。