Skip to main content
QUICK REVIEW

[论文解读] Learning multivariate functions with low-dimensional structures using polynomial bases

Daniel Potts, Michael Schmischke|arXiv (Cornell University)|Dec 6, 2019
Probabilistic and Robust Engineering Design参考文献 38被引用 13
一句话总结

本文提出了一种基于多项式基和ANOVA分解的方法,用于通过低维结构近似高维函数。通过利用稀疏ANOVA项和快速变换,该方法实现了高精度的散乱数据近似,并具备可解释性,在d=10时Friedman测试函数的中位均方误差(MSE)低于1.2,在d=4时为17.22×10⁻³,达到当前最优性能。

ABSTRACT

In this paper we propose a method for the approximation of high-dimensional functions over finite intervals with respect to complete orthonormal systems of polynomials. An important tool for this is the multivariate classical analysis of variance (ANOVA) decomposition. For functions with a low-dimensional structure, i.e., a low superposition dimension, we are able to achieve a reconstruction from scattered data and simultaneously understand relationships between different variables.

研究动机与目标

  • 解决高维散乱数据近似中的维度灾难问题。
  • 通过ANOVA分解识别重要变量及其相互作用,实现可解释建模。
  • 开发一种快速、稳定的算法,利用正交多项式基近似具有低维结构的函数。
  • 提供一个同时实现函数近似并揭示其结构依赖关系的框架。

提出的方法

  • 使用ANOVA分解将d元函数按变量子集分解为正交项。
  • 在加权L2空间中使用完备或正交多项式基(如切比雪夫多项式)表示函数。
  • 应用快速多项式变换和非等距余弦变换,以O(N^d log^d N + M)的运算量高效计算部分和。
  • 通过捕获低复杂度相互作用的稀疏索引集I截断ANOVA分解。
  • 利用分组变换求解最小二乘问题,从散乱数据中计算基系数。
  • 使用全局敏感性指数识别并验证重要的ANOVA项。

实验结果

研究问题

  • RQ1ANOVA分解能否有效从散乱数据中揭示高维函数的低维结构?
  • RQ2如何利用快速变换使高维多项式近似在计算上变得可行?
  • RQ3ANOVA项中的稀疏性在多大程度上能提高近似精度并减少数据需求?
  • RQ4与现有机器学习模型相比,该方法在基准函数上的精度和可解释性表现如何?

主要发现

  • 在Friedman 1(d=10)的100组测试集中,该方法的中位均方误差(MSE)为1.17,优于支持向量机、线性模型、神经网络和随机森林。
  • 在Friedman 2(d=10)中,中位MSE为16.09×10³,低于表3中列出的所有基准方法。
  • 在Friedman 3(d=4)中,中位MSE为17.22×10⁻³,再次优于所有对比模型。
  • 通过敏感性指数与阈值化处理,该方法成功恢复了所有三个Friedman函数的真实活跃ANOVA项(U*₁, U*₂, U*₃)。
  • 该方法在100组随机节点与测试集对中表现出稳健性,各次实验的中位误差保持一致。
  • 快速变换的使用实现了高效评估与系数计算,其性能随维度和次数的增加而良好扩展。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。