QUICK REVIEW
[论文解读] Capacities, Measurable Selection and Dynamic Programming Part I: Abstract Framework
El Karoui Nicole, Xiaolu Tan|arXiv (Cornell University)|Oct 12, 2013
Economic theories and models参考文献 20被引用 49
一句话总结
本文利用容量理论和可测选择定理,构建了一个连续时间动态规划原理(DPP)的抽象框架。通过投影容量建立了通用的可测选择结果,并将其应用于规范的 càdlàg 路径空间上的随机控制/停止问题,证明了值函数的上半分析性与时间一致性。
ABSTRACT
We give a brief presentation of the capacity theory and show how it derives naturally a measurable selection theorem following the approach of Dellacherie (1972). Then we present the classical method to prove the dynamic programming of discrete time stochastic control problem, using measurable selection arguments. At last, we propose a continuous time extension, that is an abstract framework for the continuous time dynamic programming principle (DPP).
研究动机与目标
- 通过投影容量使用容量理论推导一个通用的可测选择定理,扩展经典结果。
- 建立随机控制与停止问题在连续时间下的动态规划原理(DPP)的扩展。
- 为规范的 càdlàg 路径空间上的时间一致非线性算子提供统一框架。
- 在一般随机控制设置中确保值函数的可测性与正则性。
- 为后续论文研究一般随机控制/停止问题奠定基础。
提出的方法
- 使用 Choquet 的容量理论以及乘积空间上的投影容量构造可测选择。
- 在紧致设定下使用首次出场方法定义选择,随后通过逼近方法推广。
- 采用同构论证将选择定理推广至 Borel 集与解析集。
- 在规范的 càdlàg 路径空间上,定义以停时为指标的非线性算子族。
- 使用正则条件概率分布(r.c.p.d.)分解测度,并验证时间一致性。
- 应用 Jankov-von Neumann 解析选择定理,确保在 DPP 证明中可测选择的成立。
实验结果
研究问题
- RQ1如何系统地利用容量理论推导可测选择定理?
- RQ2在连续时间随机控制中,何种抽象条件可确保动态规划原理成立?
- RQ3如何通过选择与过去信息表征非线性算子的时间一致性?
- RQ4在一般控制/停止问题下,值函数继承了哪些正则性性质?
- RQ5如何利用可测选择将离散时间 DPP 推广至连续时间?
主要发现
- 值函数 $ V(t, \mathbf{x}) $ 是上半分析的且普遍可测,确保其在各种概率测度下具有鲁棒性。
- 动态规划原理以如下形式成立:$ V(t,\mathbf{x}) = \mathbb{E}^{\widehat{\mathbb{P}}} \left[ \mathbf{1}_{\Theta_{\infty} \leq \hat{\tau}} \Phi + \mathbf{1}_{\Theta_{\infty} > \hat{\tau}} V(\hat{\tau}, [X]_{\hat{\tau}}) \right] $,对任意 $ \widehat{\mathbb{F}} $-停时 $ \hat{\tau} $ 成立。
- 概率测度族 $ \widehat{\mathcal{P}}^{0}_{t,\mathbf{x}} $ 在时间条件粘贴下封闭,确保了时间一致性。
- 可测选择定理由基于容量的逼近与同构关系导出,推广了经典结果。
- 该框架通过规范路径空间将离散时间 DPP 与赌场模型推广至连续时间。
- 值函数仅依赖于时间 $ t $ 之前的历史信息,即 $ V(t,\mathbf{x}) = V(t, [\mathbf{x}]_t) $,确认了路径内在依赖性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。