QUICK REVIEW

[논문 리뷰] Bayesian Optimization of Combinatorial Structures

Ricardo Baptista, Matthias Poloczek|arXiv (Cornell University)|2018. 06. 22.

Machine Learning and Algorithms참고 문헌 40인용 수 54

한 줄 요약

tldr: css를 소개합니다. 조합 도메인에서의 비싼 블랙박스 함수에 대한 베이지안 최적화 알고리즘으로, 희소 베이지안 선형 모델과 SDP를 통한 볼록 완화-획득(acquisition) 및 무작위 반올림을 사용하여 큰 이산 공간을 효율적으로 탐색합니다.

ABSTRACT

The optimization of expensive-to-evaluate black-box functions over combinatorial structures is an ubiquitous task in machine learning, engineering and the natural sciences. The combinatorial explosion of the search space and costly evaluations pose challenges for current techniques in discrete optimization and machine learning, and critically require new algorithmic ideas. This article proposes, to the best of our knowledge, the first algorithm to overcome these challenges, based on an adaptive, scalable model that identifies useful combinatorial structure even when data is scarce. Our acquisition function pioneers the use of semidefinite programming to achieve efficiency and scalability. Experimental evaluations demonstrate that this algorithm consistently outperforms other methods from combinatorial and Bayesian optimization.

연구 동기 및 목표

비용이 많이 들고 평가가 비싼 블랙박스 함수를 조합 구조에서 최적화하는 문제를 다룬다.
구조적 요소 간 상호 작용을 포착하는 확장 가능한 표본 효율적인 모델을 개발한다.
조합 도메인에서의 계산적 최적화를 가능하게 하는 볼록 최적화를 활용하는 획득 전략을 제공한다.
다양한 벤치마크에서 최첨단 방법보다 성능이 향상되었음을 보여준다.

제안 방법

상호작용 계수에 희소성 유도 사전(horseshoe)을 갖는 이진 변수의 2차(제곱) 함수로 목표를 모델링한다.
효율성을 위해 Bhattacharya 등(2016)의 정확한 샘플러를 사용하는 Gibbs 샘플러로 계수에 대해 베이지안 추론을 수행한다.
후방에서 α를 샘플링하고 max f_alpha(x) - lambda P(x)의 이진 2차 프로그래밍을 푸는 톰슨-유사 획득 전략을 사용한다.
이진 2차 프로그래밍 문제를 단위 구(sphere) 위의 벡터 프로그램으로 완화한 뒤, 무작위 반올림(Charikar & Wirth, 2004)을 통해 이산 해를 복구한다.
대규모 차원에서 SDP를 시뮬레이티드 어닐링으로 대체하는 저복잡도 변형(BOCS-SA)을 제공한다.

실험 결과

연구 질문

RQ1한정된 데이터로 조합 구조에서 비용이 많이 드는 블랙박스 함수를 어떻게 효율적으로 최적화할 수 있는가?
RQ2상호 작용을 고려한 희소 베이지안 모델이 이산 도메인에서 구조-함수 관계를 정확히 포착할 수 있는가?
RQ3세미디파인드 프로그래밍 기반의 획득이 이산적이고 고차원 공간에서 전통적 획득 함수보다 우수한가?

주요 결과

설정	EI	BOCS-SA	BOCS-SDP
(L_c=1, lambda=0)	0.49±0.13	0.02±0.02	0.03±0.02
(L_c=1, lambda=1e-4)	0.50±0.12	0.02±0.01	0.03±0.03
(L_c=1, lambda=1e-2)	0.54±0.12	0.02±0.02	0.05±0.05
(L_c=10, lambda=0)	2.54±0.51	0.07±0.05	0.07±0.05
(L_c=10, lambda=1e-4)	2.49±0.44	0.06±0.04	0.08±0.05
(L_c=10, lambda=1e-2)	2.27±0.40	0.04±0.04	0.10±0.06
(L_c=100, lambda=0)	3.38±0.70	0.15±0.07	0.11±0.06
(L_c=100, lambda=1e-4)	4.07±0.77	0.16±0.08	0.15±0.08
(L_c=100, lambda=1e-2)	4.25±0.78	0.17±0.09	0.13±0.07

css는 이진 2차 프로그래밍, Ising 희소화, 오염 제어, 항공-구조 문제에서 경쟁 방법(EI, SMAC, PS, SA, OLS, RS)보다 지속적으로 더 나은 성능을 보입니다.
BCS-SDP(SDP 기반)이 벤치마크 전반에서 최상의 성능을 자주 보여주며, BOCS-SA(SA 기반)가 많은 설정에서 그 뒤를 잇습니다.
단일 MLE를 사용하는 대신 회귀 계수의 후방에서 샘플링하는 것이 순수하게 탐욕적 행동을 피하고 강한 성능을 달성하는 데 필수적입니다.
Ising 희소화에서 BOCS-SDP가 10개의 무작위 모델에서 가장 낮은 변동성으로 최상의 값을 달성합니다.
오염 제어 및 항공-구조 문제에서 BOCS-SDP가 자주 최고 성능을 제공하는 반면, SA와 EI는 가끔 초기에는 잘 수행되지만 css를 지속적으로 이기지 못합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.