QUICK REVIEW

[논문 리뷰] Robust Optimization for Non-Convex Objectives

Robert F. Chen, Brendan Lucier|arXiv (Cornell University)|2017. 07. 04.

Machine Learning and Algorithms참고 문헌 10인용 수 45

한 줄 요약

이 논문은 비볼록 목표 함수에 대한 강건 최적화를 $α$-근사 오라클을 사용한 베이지안 최적화로 환원하는 방법을 제안한다. 학습자와 적대자 사이의 0-합 게임에서의 무실책 동역학을 활용함으로써, 볼록화된 해공간 내에서 $α$-근사 강건 해를 달성할 수 있으며, 신경망 학습과 영향력 최대화 문제에 대한 실험적 검증을 수행한다.

ABSTRACT

We consider robust optimization problems, where the goal is to optimize in the worst case over a class of objective functions. We develop a reduction from robust improper optimization to Bayesian optimization: given an oracle that returns $α$-approximate solutions for distributions over objectives, we compute a distribution over solutions that is $α$-approximate in the worst case. We show that de-randomizing this solution is NP-hard in general, but can be done for a broad class of statistical learning tasks. We apply our results to robust neural network training and submodular optimization. We evaluate our approach experimentally on corrupted character classification, and robust influence maximization in networks.

연구 동기 및 목표

비볼록 목표 함수에서의 불확실성 하에서의 강건 최적화 문제를 다루기 위해, 개별 목표 함수가 정확히 최적화하기 어려운 경우를 고려한다.
기존 해공간이 비볼록일지라도, $α$-근사 베이지안 오라클을 $α$-근사 강건 해로 변환할 수 있는 일반적인 방법을 개발한다.
기존 해공간에서의 정확한 강건 최적화가 NP-난해이므로, 일반적으로 해를 결정화하는 것이 필요하다는 것을 보여준다.
예측 변수에서 손실 함수가 볼록인 통계적 학습 과제에서는 단일 결정론적 해가 랜덤화된 해와 동일한 근사 보장을 달성할 수 있음을 보여준다.
다양한 손상 모델 하에서 신경망 학습과 불확실성 하에서의 영향력 최대화 과제에 대해 제안된 방법을 실증적으로 검증한다.

제안 방법

학습자(정확도 $α$-근사 베이지안 오라클을 갖는 자)와 악성 손실 분포를 선택하는 적대자 간의 0-합 게임으로 강건 최적화를 공식화한다.
게임에 대해 무실책 동역학을 적용함으로써, $T$ 라운드 동안 $O(T^{-1/2})$의 실책을 가지며 $α$-근사 최소최대 해로 수렴한다.
손실 함수(예: 손상 유형)에 대한 분포를 적응적으로 조정하기 위해 파rameter $γ$를 사용한 곱셈 가중치 업데이트를 수행한다.
최종 해가 원래 해의 분포인 비정상 학습을 허용하는 볼록화된 해공간을 유도한다.
비볼록 목표 함수일지라도, 임의의 $α$-근사 베이지안 오라클을 $α$-근사 강건 해로 환원하는 환원 기법을 제안한다.
실제 및 시뮬레이션 데이터를 사용한 네트워크 내에서의 영향력 최대화와 손상된 입력에서의 문자 분류 실험을 통해 접근 방식을 검증한다.

실험 결과

연구 질문

RQ1비볼록 목표 함수에 대해 $α$-근사 베이지안 오라클을 사용하여 $α$-근사 강건 해를 구성할 수 있는가?
RQ2해를 결정화하지 않고도 강건 최적화를 달성할 수 있는가, 아니면 일반적으로 비정상 학습이 필수적인가?
RQ3곱셈 가중치 파rameter $γ$의 선택이 실무에서 수렴성과 성능에 어떤 영향을 미치는가?
RQ4제안된 방법이 평균 케이스 최적화나 개별 손실 최적화와 같은 기준 방법보다 강건 학습 과제에서 더 우수한 성능을 보일 수 있는가?
RQ5신경망 학습과 불확실성 하에서의 영향력 최대화와 같은 실제 문제에 대해 이 방법이 스케일링 가능한가?

주요 결과

제안된 환원 기법은 목표 함수가 비볼록일지라도 $α$-근사 강건 해를 $α$-근사 베이지안 오라클을 사용하여 달성할 수 있다.
해를 결정화하는 것은 증명적으로 필수적이다: 정확한 베이지안 오라클과 다항 수의 손실 함수가 존재하더라도, 원래 해공간에서의 강건 최적화는 NP-난해하다.
예측 변수에서 손실 함수가 볼록인 통계적 학습 과제에서는 단일 결정론적 해가 랜덤화된 해와 동일한 근사 보장을 달성할 수 있다.
손상된 입력에서의 문자 인식 실험 결과, 제안된 강건 최적화 방법이 평균 케이스 최적화 및 개별 손실 최적화와 같은 기준 방법보다 유의미하게 뛰어난 성능을 보였다.
영향력 최대화 과제에서, 위키백과 A 그래프에서의 최악의 영향력은 94.33(90.61, 98.05)를 기록하여, 균일 기준(82.30)과 변형된 분포 기준(83.35)을 모두 초월했으며, 통계적으로 유의미한 차이를 보였다.
강건 최적화 절차에서 생성된 개별 시드 세트는 완전 A 그래프에서 절대 최고 시드 세트 대비 평균 비율 0.733을 기록했고, 위키백과 A에서는 0.995를 기록하여 현실적인 그래프에서 뛰어난 성능을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.