Skip to main content
QUICK REVIEW

[논문 리뷰] Auto-WEKA: Automated Selection and Hyper-Parameter Optimization of Classification Algorithms

Chris Thornton, Frank Hutter|arXiv (Cornell University)|2012. 08. 18.
Fuzzy Logic and Control Systems인용 수 53
한 줄 요약

Auto-WEKA는 WEKA 내부의 47개 분류기 전반에 걸쳐 베이지안 최적화를 사용하여 최적의 기계학습 분류기와 그 하이퍼파rameter를 동시에 선택하는 완전 자동화된 프레임워크를 제안한다. 이는 10개의 UCI 기준 데이터셋에서 기본 설정 대비 뛰어난 분류 성능을 달성하여 종단 간 자동 모델 선택 및 하이퍼파rameter 튜닝의 가능성을 입증한다.

ABSTRACT

There exists a large variety of machine learning algorithms; as most of these can be configured via hyper-parameters, there is a staggeringly large number of possible alternatives overall. There has been a consid-erable amount of previous work on choosing among learning algorithms and, separately, on optimizing hyper-parameters (mostly when these are continuous and very few in number) in a given use context. However, we are aware of no work that addresses both problems together. Here, we demonstrate the feasibility of using a fully automated approach for choosing both a learning algorithm and its hyper-parameters, leveraging recent innovations in Bayesian optimization. Specifically, we apply this approach to the full range of classifiers implemented in WEKA, spanning 3 ensemble methods, 14 meta-methods, 30 base classifiers, and a wide range of hyper-parameter settings for each of these. On each of 10 popular data sets from the UCI repository, we show classification performance better than that of complete cross-validation over the default hyper-parameter settings of our 47 classification algorithms. We believe that our approach, which we dubbed Auto-WEKA, will enable typical users of machine learning algorithms to make better choices and thus to obtain better performance in a fully automated fashion. 1

연구 동기 및 목표

  • 기존에 함께 고려되지 않았던 최적의 학습 알고리즘과 하이퍼파aram터를 동시에 선택하는 도전 과제를 해결하기 위해.
  • 전문 지식이 없거나 기계학습 전문 지식이 제한된 사용자가 수동 튜닝 없이도 더 나은 분류 성능을 달성할 수 있도록 하기 위해.
  • 알고리즘 선택 및 하이퍼파aram터 최적화의 전체 파이프라인을 확장 가능하고 효과적으로 자동화하는 것이 가능한지 입증하기 위해.
  • 다양한 분류기와 실제 세계 데이터셋에 걸쳐 제안된 접근법의 성능을 평가하기 위해.
  • 자동 선택이 여러 표준 기준 데이터셋에서 기본 설정을 초월할 수 있는지 보여주기 위해.

제안 방법

  • 이 방법은 학습 알고리즘과 하이퍼파aram터의 결합 공간을 탐색하기 위해 베이지안 최적화를 사용한다.
  • 30개의 기본 분류기, 14개의 메타 방법, 3개의 앙상블 방법을 포함한 WEKA 내부의 전체 47개 분류기를 활용한다.
  • 연속형 및 이산형 하이퍼파aram터에 대해 하이퍼파aram터 탐색을 수행하며, 각 설정은 교차검증을 통해 평가된다.
  • 최적화 과정은 확률 모델을 활용하여 효율적으로 유망한 설정으로 탐색을 이끈다.
  • 초기 설정 이후 사용자 간섭 없이 완전히 자동화된 프레임워크로 설계되어 있다.
  • 일반성 확보를 위해 10개의 표준 UCI 기준 데이터셋을 사용하여 성능을 평가한다.

실험 결과

연구 질문

  • RQ1완전 자동화된 시스템이 분류기 선택과 하이퍼파aram터 튜닝을 동시에 최적화하여 기본 설정을 초월할 수 있는가?
  • RQ2다양한 분류기와 하이퍼파aram터의 복잡한 탐색 공간에서 베이지안 최적화의 효과는 어떠한가?
  • RQ3제안된 접근법은 다양한 실제 세계 데이터셋에서 일관되게 분류 성능을 향상시킬 수 있는가?
  • RQ4완전한 교차검증을 통해 기본 설정을 초월하는 결과를 얻을 수 있는가?
  • RQ5자동화가 모델 선택에 있어 전문 지식이 필요한 정도를 어느 정도 감소시킬 수 있는가?

주요 결과

  • Auto-WEKA는 10개의 UCI 기준 데이터셋 전부에서 기본 하이퍼파aram터 설정에 대한 완전한 교차검증보다 더 뛰어난 분류 성능을 달성했다.
  • 사용자 간섭 없이도 프레임워크가 우수한 모델과 하이퍼파aram터를 성공적으로 식별하여 종단 간 자동화의 가능성을 입증했다.
  • 기본 설정을 초월하는 성능 향상이 기본, 메타, 앙상블 방법을 포함한 다양한 분류기 유형에서 모두 관찰되었다.
  • 베이지안 최적화가 알고리즘과 하이퍼파aram터 조합의 고차원 탐색 공간을 효과적으로 탐색했다.
  • 알고리즘과 하이퍼파aram터를 동시에 최적화하는 것이 개별적으로 하나의 요소만 최적화하는 것보다 유의미한 성능 향상을 이끌어낸다.
  • 일반 사용자가 기계학습 설정 전문 지식 없이도 더 나은 성능을 얻을 수 있도록 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.