[论文解读] Optimal dividends with partial information and stopping of a degenerate reflecting diffusion
本文研究了企业在其盈利能力信息不完全的情况下最优股利分配问题,将管理者对趋势项的信念建模为随机信念状态。通过使用退化反射扩散过程和一种新颖的概率方法,证明了值函数是自由边界问题的光滑解,并构建了一种基于学习动态调整的最优股利策略,其最优边界依赖于财富水平与信念状态。
We study the optimal dividend problem for a firm's manager who has partial information on the profitability of the firm. The problem is formulated as one of singular stochastic control with partial information on the drift of the underlying process and with absorption. In the Markovian formulation, we have a 2-dimensional degenerate diffusion, whose first component is singularly controlled and it is absorbed as it hits zero. The free boundary problem (FBP) associated to the value function of the control problem is challenging from the analytical point of view due to the interplay of degeneracy and absorption. We find a probabilistic way to show that the value function of the dividend problem is a smooth solution of the FBP and to construct an optimal dividend strategy. Our approach establishes a new link between multidimensional singular stochastic control problems with absorption and problems of optimal stopping with `creation'. One key feature of the stopping problem is that creation occurs at a state-dependent rate of the `local-time' of an auxiliary 2-dimensional reflecting diffusion.
研究动机与目标
- 建模当企业经理对盈利能力信息不完全时的最优股利分配,其中信念状态用于表示该信息。
- 分析一个在零处具有吸收特性的1D布朗运动趋势项部分信息下的奇异随机控制问题。
- 证明值函数作为涉及退化性和吸收性的复杂自由边界问题的解,其存在性与光滑性。
- 构建一种基于管理者对企业发展盈利能力信念动态演变的最优股利策略。
- 建立奇异控制与涉及二维反射扩散过程局部时间的、具有状态依赖性“生成”机制的最优停止问题之间的联系。
提出的方法
- 将问题表述为具有奇异控制的第一分量和在零处吸收的二维退化扩散过程。
- 使用信念过程 π ∈ (0,1) 来表示管理者对趋势项 μ 的部分信息,其通过贝叶斯规则演化。
- 应用概率验证方法,证明值函数满足自由边界问题(FBP),且无需依赖经典PDE正则性理论。
- 提出奇异控制与吸收问题和具有“生成”机制的最优停止问题之间的一种新颖联系,其“生成”速率与二维反射扩散过程的局部时间成正比。
- 采用光滑化和弱收敛技术来逼近值函数,并在粘性解意义下验证HJB方程。
- 使用带跳跃和连续部分的伊藤公式推导动态规划不等式,并证明策略的最优性。
实验结果
研究问题
- RQ1企业盈利能力的部分信息在多大程度上影响最优股利政策?
- RQ2当管理者对趋势项的信念是随机且随时间演变时,最优股利边界的结构是怎样的?
- RQ3能否在不依赖经典PDE正则性假设的前提下,证明具有吸收和部分信息的奇异控制问题的值函数是光滑的?
- RQ4最优控制如何与一个具有状态依赖性“生成”机制的辅助最优停止问题相联系?
- RQ5当管理者信念趋于确定性(π → 0 或 π → 1)时,最优策略的长期行为如何?
主要发现
- 尽管存在退化性和吸收性,值函数仍是自由边界问题的光滑解,这是新颖的分析结果。
- 最优股利策略属于“障碍型”,即当财富超过依赖于当前信念 π 的阈值时支付股利。
- 临界股利边界随 π 增大而上升,反映出对盈利能力信心增强导致更高的派息阈值。
- 当 π → 1 时,最优策略收敛于完全信息下的解;当 π → 0 时,收敛于立即清算策略,与已知结果一致。
- 最优控制由一个自由边界刻画,该边界将继续区域与股利支付区域分隔,且边界关于 π 光滑依赖。
- 本文建立了奇异控制与吸收问题和通过二维反射扩散过程局部时间实现的“生成”机制的最优停止问题之间的一种新概率联系。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。