[论文解读] Deep backward schemes for high-dimensional nonlinear PDEs
本文提出了深度向后动态规划方案(DBDP1 和 DBDP2),通过将 BSDE 表示与神经网络耦合,求解高维非线性偏微分方程和变分不等式,并在维度高达 50 时实现收敛性和良好性能。
We propose new machine learning schemes for solving high dimensional nonlinear partial differential equations (PDEs). Relying on the classical backward stochastic differential equation (BSDE) representation of PDEs, our algorithms estimate simultaneously the solution and its gradient by deep neural networks. These approximations are performed at each time step from the minimization of loss functions defined recursively by backward induction. The methodology is extended to variational inequalities arising in optimal stopping problems. We analyze the convergence of the deep learning schemes and provide error estimates in terms of the universal approximation of neural networks. Numerical results show that our algorithms give very good results till dimension 50 (and certainly above), for both PDEs and variational inequalities problems. For the PDEs resolution, our results are very similar to those obtained by the recent method in \\cite{weinan2017deep} when the latter converges to the right solution or does not diverge. Numerical tests indicate that the proposed methods are not stuck in poor local minimaas it can be the case with the algorithm designed in \\cite{weinan2017deep}, and no divergence is experienced. The only limitation seems to be due to the inability of the considered deep neural networks to represent a solution with a too complex structure in high dimension.
研究动机与目标
- 解决求解非线性抛物型偏微分方程时的维度灾难。
- 利用 BSDE 表示将 PDE 重构为便于数值求解的形式。
- 开发两种基于神经网络的方案(DBDP1 和 DBDP2),并采用向后归纳(backward induction)。
- 证明收敛性并给出与神经网络逼近相关的误差估计。
- 在高维(约 50)及变分不等式情形下展示数值有效性。
提出的方法
- 通过欧拉方案对 BSDE 进行离散化并进行向后归纳。
- 在每个时间步用神经网络估计解及(对于 DBDP1)其梯度。
- DBDP1 每步用两个网络同时学习 u 和 Z(梯度);DBDP2 学习 u,并通过数值微分推导 Z。
- 通过反射 BSDE 的公式化(RDBDP)将框架扩展到变分不等式。
- 给出收敛性分析,表明误差取决于时间离散化、前向/后向正则性,以及神经网络逼近能力。
实验结果
研究问题
- RQ1当时间离散化细化时,所提出的深度向后方案是否能够收敛到真实的 BSDE/解?
- RQ2每一步的神经网络近似误差如何影响整体收敛性和误差界?
- RQ3DBDP1 和 DBDP2 是否缓解先前深度 BSDE 方法中出现的局部极小值问题?
- RQ4这些方法是否能够有效求解高维非线性 PDEs 与变分不等式(如美国期权),维度约为 50?
- RQ5当真实解具有非常复杂的高维结构时,有哪些局限性?
主要发现
- 在标准的 Lipschitz 条件和正则性假设下,DBDP1/DBDP2 收敛到 BSDE 解,其误差受神经网络逼近误差控制。
- 推导出一个显式误差界:总误差由端点近似、时间离散化、Z-正则性和神经网络近似项共同组成。
- 数值实验在解可以被神经网络表示时,求解高维问题(最高维度 50),结果可与或优于先前方法如 Deep BSDE(在收敛条件下)的结果。
- DBDP 方法减少了影响某些先前方案的局部极小值问题,改善了实际收敛性。
- 变分不等式扩展(RDBDP)在相对较高的维度(约 40)下也能准确处理美式期权风格的问题。
- 观察到的一个局限是神经网络在表示具有非常复杂高维结构的解时的能力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。