Skip to main content
QUICK REVIEW

[论文解读] Batched Large-scale Bayesian Optimization in High-dimensional Spaces

Zi Wang, Clement Gehring|arXiv (Cornell University)|Jun 5, 2017
Gaussian Processes and Bayesian Inference参考文献 24被引用 70
一句话总结

本文提出 Ensemble Bayesian Optimization (EBO),一种可扩展的贝叶斯优化框架,适用于高维度、大规模问题,利用基于 Mondrian 的划分通过 Gibbs 采样学习的 TileGPs 集成,以实现并行批量查询并获得改进的不确定性估计。

ABSTRACT

Bayesian optimization (BO) has become an effective approach for black-box function optimization problems when function evaluations are expensive and the optimum can be achieved within a relatively small number of queries. However, many cases, such as the ones with high-dimensional inputs, may require a much larger number of observations for optimization. Despite an abundance of observations thanks to parallel experiments, current BO techniques have been limited to merely a few thousand observations. In this paper, we propose ensemble Bayesian optimization (EBO) to address three current challenges in BO simultaneously: (1) large-scale observations; (2) high dimensional input spaces; and (3) selections of batch queries that balance quality and diversity. The key idea of EBO is to operate on an ensemble of additive Gaussian process models, each of which possesses a randomized strategy to divide and conquer. We show unprecedented, previously impossible results of scaling up BO to tens of thousands of observations within minutes of computation.

研究动机与目标

  • 解决高维度、大规模环境下的贝叶斯优化挑战。
  • 利用并行性加速函数评估和后验推断。
  • 开发保持局部性并提供不确定性估计的分区式 GP 集成框架。
  • 实现自动批量查询生成,平衡质量与多样性。

提出的方法

  • 使用 Mondrian 过程将输入空间划分为 J 个区域。
  • 在每个分区内,通过 Gibbs 采样学习局部 TileGP(具有加性结构和 tile/mondrian 特征的 GP),以推断核宽度和分解。
  • 构建分区特定 GP 模型的集合,并在每次迭代中抽取一个成员进行搜索和估计。
  • 在加性分量内局部优化采集函数,实现类似块坐标优化。
  • 跨分区聚合候选点,并通过引入对数行列式多样性项和基于采集分数的筛选步骤实现对多样性的考虑。
  • 在工作节点之间同步学习到的分区参数,形成全局查询批。

实验结果

研究问题

  • RQ1贝叶斯优化如何扩展到高维空间中的数万次观测?
  • RQ2具有加性结构的分区 GP 模型集合在实现并行批量查询生成的同时,能否提供准确的不确定性估计?
  • RQ3基于 Mondrian 的分区结合 tile 编码是否能够在不牺牲优化质量的前提下实现可扩展、并行化的 BO?
  • RQ4在合成任务和实际任务中,EBO 在速度和解质量方面相较于现有可扩展 BO 方法有何差异?

主要发现

  • 与最先进方法相比,EBO 将后验推断加速了 2–3 个数量级(在一个案例中最高可达 400 倍)。
  • EBO 能在并行计算下处理数万个观测,同时保持具有竞争力甚至优越的优化质量。
  • 使用 tile 编码和 Gibbs 采样的加性 GP 能有效学习核结构和分解,从而实现可扩展的 BO。
  • 跨 Mondrian 分区的并行 Gibbs 采样和批量查询选择带来显著加速(例如,在 240 核对 10 核的场景下约 20x)。
  • 在报道的实验中,EBO 在若干控制和轨迹优化任务中优于如 BO-SVI、BO-Add-SVI 和 CEM 等替代方法。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。