[论文解读] A closed form solution for a stochastic control problem with quasi-polynomial value function
本文为具有跳变的随机控制问题提供了闭式解,其中值函数为时间与状态相关的二次多项式。通过将哈密顿-雅可比-贝尔曼(HJB)偏微分方程(PDE)简化为可解的常微分方程(ODE)系统,作者推导出扩散和跳变分量的显式最优控制策略,并识别出一个随时间变化的边界,将继续区域(最优跳变大小为正)与停止区域(最优跳变大小为零)分隔开来。
We study a constrained stochastic control problem with jumps; the jump times of the controlled process are given by a Poisson process. The cost functional comprises quadratic components for an absolutely continuous control and the controlled process and an absolute value component for the control of the jump size of the process. We characterize the value function by a polynomial of degree two whose coefficients depend on the state of the system; these coefficients are given by a coupled system of ODEs. The problem hence reduces from solving the Hamilton Jacobi Bellman (HJB) equation (i.e., a PDE) to solving an ODE whose solution is available in closed form. The state space is separated by a time dependent boundary into a continuation region where the optimal jump size of the controlled process is positive and a stopping region where it is zero. We apply the optimization problem to a problem faced by investors in the financial market who have to liquidate a position in a risky asset and have access to a dark pool with adverse selection.
研究动机与目标
- 求解一个具有泊松驱动跳变以及混合二次和绝对值成本分量的约束随机控制问题。
- 将值函数表征为拟多项式(状态的二次函数),其系数由ODE系统控制。
- 识别出一个随时间变化的边界,将继续区域(最优跳变大小为正)与停止区域(最优跳变大小为零)分隔开来。
- 将该解应用于具有逆向选择风险的暗池中金融市场的最优平仓问题。
- 提供一种闭式解,通过将HJB方程简化为ODE系统,避免数值求解PDE的方法。
提出的方法
- 将受控过程建模为具有泊松跳变时间的跳扩散过程,并对跳变大小施加控制。
- 定义成本泛函,其中包含扩散控制和状态过程的二次项,以及跳变大小控制的绝对值项。
- 假设值函数是状态变量的二次多项式,其系数随时间变化。
- 通过HJB方程推导出值函数系数的耦合常微分方程(ODE)系统。
- 以闭式解求解ODE系统,获得最优控制策略的显式表达式。
- 将最优策略识别为一个随时间变化的边界:在继续区域内跳变控制为正,在停止区域内为零。
实验结果
研究问题
- RQ1能否为具有跳变以及混合二次和绝对值成本分量的随机控制问题推导出闭式解?
- RQ2最优跳变大小控制策略如何依赖于状态和时间?继续区域与停止区域之间的边界由什么决定?
- RQ3在该设定下,哈密顿-雅可比-贝尔曼PDE在多大程度上可以被简化为可解的ODE系统?
- RQ4值函数的结构(拟多项式)如何实现最优控制的显式表征?
- RQ5所推导的最优平仓策略在具有逆向选择的暗池中的金融含义是什么?
主要发现
- 值函数被显式表征为状态变量的二次多项式,其系数随时间变化。
- 值函数的系数满足一个可闭式求解的耦合ODE系统。
- 最优跳变大小在由随时间变化的边界定义的继续区域内为正,在停止区域内为零。
- HJB PDE被有效简化为求解ODE系统,避免了数值PDE求解方法。
- 该模型为在存在逆向选择风险的暗池中实现金融市场最优平仓提供了一个可处理的框架。
- 解的结构允许无需数值近似即可显式计算最优控制策略。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。