[论文解读] High Dimensional Bayesian Optimisation and Bandits via Additive Models
本文提出 Add-GP-UCB,一种用于高维函数的贝叶斯优化与多臂赌博机算法,通过将函数建模为低维分量的加法函数。利用该结构,该方法仅以维度 D 的线性依赖关系实现遗憾,从而在标准 GP 基方法失效的高维场景中实现高效优化。
Bayesian Optimisation (BO) is a technique used in optimising a $D$-dimensional function which is typically expensive to evaluate. While there have been many successes for BO in low dimensions, scaling it to high dimensions has been notoriously difficult. Existing literature on the topic are under very restrictive settings. In this paper, we identify two key challenges in this endeavour. We tackle these challenges by assuming an additive structure for the function. This setting is substantially more expressive and contains a richer class of functions than previous work. We prove that, for additive functions the regret has only linear dependence on $D$ even though the function depends on all $D$ dimensions. We also demonstrate several other statistical and computational benefits in our framework. Via synthetic examples, a scientific simulation and a face detection problem we demonstrate that our method outperforms naive BO on additive functions and on several examples where the function is not additive.
研究动机与目标
- 解决贝叶斯优化(BO)与高斯过程赌博机(GPB)在高维问题中的可扩展性挑战,其中标准方法面临样本复杂度指数级增长与计算不可行性。
- 克服两大关键挑战:高维场景下的统计估计困难与获取函数最大化的计算不可行性。
- 提出一种假设目标函数具有加法结构的框架,该假设比先前的低维子空间假设更具表达力。
- 证明在该加法假设下,遗憾随维度 D 线性增长,显著优于标准 GPB 中的指数级增长。
- 开发一种实用算法(Add-GP-UCB),在真实世界应用中平衡统计表达力与计算效率,适用于昂贵函数评估场景。
提出的方法
- 将未知函数 f 建模为 D 个输入维度的加法函数,分解为低维分量(例如,f(x) = Σ f_i(x_i),其中变量为不相交子集)。
- 使用加法高斯过程(Add-GP)对函数建模,其中每个分量独立地通过 GP 建模,从而降低整体模型复杂度。
- 设计一种利用加法结构实现高维可优化的获取函数(UCB 类型),支持高效的探索-利用权衡。
- 通过在加法分量上使用随机搜索或局部优化来优化获取函数,避免全维全局优化。
- 将加法 GP 模型与 GP-UCB 获取规则相结合,在加法假设下确保理论遗憾界。
- 在真实加法结构未知时,允许部分或自适应分解学习,通过周期性重新优化分量划分实现。
实验结果
研究问题
- RQ1我们能否在高维贝叶斯优化中实现遗憾界随维度 D 线性增长,而非指数增长?
- RQ2假设目标函数具有加法结构,是否能同时实现高维 BO 与赌博机中的统计一致性与计算可处理性?
- RQ3Add-GP-UCB 在非加法与真实世界问题中,相较于标准 GP-UCB 与其他最先进方法(如 REMBO)的性能如何?
- RQ4分量大小 d 与分量数量 M 的选择对统计表达力与计算效率之间的权衡有何影响?
- RQ5该方法是否能超越加法假设,在实际非加法场景中仍优于标准 BO?
主要发现
- 当真实函数为加法结构时,Add-GP-UCB 的遗憾随维度 D 线性增长,相比标准 GPB 的指数遗憾有显著改进。
- 实验结果表明,Add-GP-UCB 在合成加法函数上优于标准 GP-UCB 与 GP-EI,在 Viola-Jones 人脸检测任务中,Add-6/4 表现最佳。
- 在天体物理模拟器上,Add-GP-UCB(d=5,M=4)在收敛性上优于 REMBO 与标准 BO,尽管真实函数并非严格加法。
- 即使真实函数非加法,该方法仍表现良好,表明对模型误设具有鲁棒性,尤其当分量大小 d 选择得当(如 d ∈ [3,12])时。
- 当已知分解且 d 较小(如 d=6,M=4)时,Add-GP-UCB 在所有基准测试中(包括 22 阶 Viola-Jones 级联优化)均持续优于 REMBO 与标准 BO。
- 作者指出理论分析中存在一个错误(具体在公式 14),正在修正,但实验结果仍强劲且与所提框架一致。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。