[论文解读] A comparison study of supervised learning techniques for the approximation of high dimensional functions and feedback control
本文比较了监督学习方法——神经网络、核方法和张量列车——在最优控制问题中逼近高维函数的性能。通过状态依赖Riccati方程生成训练数据,结果表明张量列车(尤其是TT Gradient Cross)实现了最高精度(误差约1.32×10⁻⁶),而核方法和神经网络在稀疏数据下具有更高的灵活性,尽管误差略高。
Approximation of high dimensional functions is in the focus of machine learning and data-based scientific computing. In many applications, empirical risk minimisation techniques over nonlinear model classes are employed. Neural networks, kernel methods and tensor decomposition techniques are among the most popular model classes. We provide a numerical study comparing the performance of these methods on various high-dimensional functions with focus on optimal control problems, where the collection of the dataset is based on the application of the State-Dependent Riccati Equation.
研究动机与目标
- 评估并比较神经网络、核方法和张量列车技术在逼近最优控制中出现的高维值函数方面的性能。
- 研究函数内在结构特征(如光滑性和可分性)对不同学习方法逼近精度的影响。
- 评估各方法在实际约束条件下的可行性与鲁棒性,包括数据可得性和采样策略。
- 考察结合代理模型与线性二次型调节器(LQR)的Two-Boxes(TB)反馈控制策略对稳定性的改进作用。
- 确定哪种方法在高维设置下能最好地平衡精度、泛化能力与对稀疏或非规则采样数据的适应性。
提出的方法
- 在非线性模型类上采用经验风险最小化:包括神经网络、核方法和张量列车(特别是TT Gradient Cross和块稀疏张量列车)。
- 通过状态依赖Riccati方程(SDRE)生成最优控制问题的训练数据,以实现高精度的值函数逼近。
- 应用Two-Boxes(TB)反馈控制策略:当状态接近原点时使用LQR控制;否则由代理模型的梯度驱动控制。
- 通过多个初始条件下的测试误差(errtest)和成本误差(errcost)两个指标评估逼近精度。
- TT Gradient Cross利用梯度信息与交叉近似,自适应选择采样点,提升稳定性和条件性。
- 核方法和神经网络在任意稀疏分布的数据上进行训练,而TT方法则依赖于通过主动学习获得的结构化网格采样。
实验结果
研究问题
- RQ1神经网络、核方法和张量列车在从最优控制问题中逼近高维值函数方面表现如何比较?
- RQ2函数内在属性(如光滑性和可分性)在多大程度上影响各方法的逼近误差?
- RQ3Two-Boxes反馈控制策略在结合代理模型与LQR时,如何提升稳定性和性能?
- RQ4在三种学习技术之间,精度与数据灵活性(如稀疏数据与结构化数据)之间的权衡如何?
- RQ5不同指标(如均方误差)在多大程度上能真实反映代理模型对非光滑或局部特征的捕捉能力?
主要发现
- TT Gradient Cross在所有方法中实现了最低的测试误差(1.32×10⁻⁶),表明其在光滑、结构化高维函数逼近中具有卓越精度。
- 核方法实现了第二好的测试误差(8.62×10⁻⁶),在精度上优于神经网络,同时保持了对稀疏数据的灵活性。
- 神经网络的测试误差较高(最高达8.37×10⁻⁵),但通过增加傅里叶展开项后性能有所提升,表明其对模型架构较为敏感。
- 所有方法的成本误差(errcost)均处于较窄范围内(约0.032–0.036),表明尽管函数逼近存在差异,但在控制成本最小化方面表现相当。
- TT方法因能够有效利用函数的光滑性与低秩张量结构,在高维设置下显著优于其他方法,尤其在精度方面。
- 核方法和神经网络在适应稀疏数据方面表现出更强的适应性,而TT方法依赖于主动学习的结构化网格采样,限制了其在真实世界数据中的应用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。