[논문 리뷰] Automated Machine Learning: From Principles to Practices
AutoML을 정의하고 일반 프레임워크와 문제 설정 및 기술에 따른 분류를 제시하며, 향후 연구와 응용에 대한 가이드를 제공하는 포괄적 검토.
Machine learning (ML) methods have been developing rapidly, but configuring and selecting proper methods to achieve a desired performance is increasingly difficult and tedious. To address this challenge, automated machine learning (AutoML) has emerged, which aims to generate satisfactory ML configurations for given tasks in a data-driven way. In this paper, we provide a comprehensive survey on this topic. We begin with the formal definition of AutoML and then introduce its principles, including the bi-level learning objective, the learning strategy, and the theoretical interpretation. Then, we summarize the AutoML practices by setting up the taxonomy of existing works based on three main factors: the search space, the search algorithm, and the evaluation strategy. Each category is also explained with the representative methods. Then, we illustrate the principles and practices with exemplary applications from configuring ML pipeline, one-shot neural architecture search, and integration with foundation models. Finally, we highlight the emerging directions of AutoML and conclude the survey.
연구 동기 및 목표
- AutoML 정의 및 목표 명확화(우수한 성능, 인간 노력 감소 및 계산 효율성).
- 기존 접근법을 포괄하고 새로운 방법 설계를 안내하는 일반 AutoML 프레임워크를 제안.
- 문제 설정 및 기법으로 AutoML 작업을 분류하여 관계를 밝히고 향후 연구를 촉진.
- 실무자와 연구자가 AutoML 방법을 적용하고 확장할 수 있도록 통찰과 가이드를 제공.
제안 방법
- 제약된 예산 내에서 학습 도구의 구성을 자동화하는 것을 AutoML로 형식적으로 정의.
- 최적화 도구자와 평가자로 구성된 두 구성요소의 AutoML 컨트롤러를 도입.
- 학습 과정(특징 공학, 모델 선택, 최적화 알고리즘 선택)을 AutoML 검색 공간에 매핑하는 프레임워크를 개발.
- 기본 및 숙련된 방법을 포함하여 무엇을 자동화할지에 따른 문제 설정(무엇을 자동화할지)과 기법(어떻게 자동화할지)으로 분류하는 분류체계를 제시.
- NAS를 일반 AutoML 파이프라인의 특화된 전 범위 AutoML 사례로 논의하고 이를 일반 AutoML 파이프라인과 연관지음.
- 기존 연구들이 제안된 프레임워크와 분류체계에 어떻게 부합하는지 설명.
실험 결과
연구 질문
- RQ1다양한 학습 태스크를 포괄하는 형식적이고 실행 가능한 AutoML 정의는 무엇인가?
- RQ2기존 접근법을 포함하고 새로운 방법 개발을 안내할 수 있는 일반 AutoML 프레임워크를 어떻게 구성할 수 있는가?
- RQ3문제 설정 및 기법으로 AutoML 접근법을 분류하여 구조와 개선의 기회를 어떻게 밝힐 수 있는가?
- RQ4문제 설정, 기법, 응용 및 이론 전반에 걸친 미래 AutoML 연구에 어떤 가이드를 제공할 수 있는가?
주요 결과
- AutoML은 인간의 입력 및 예산이 제한된 상황에서 학습 성능을 극대화하는 것을 목표로 한다.
- 일반 컨트롤러 프레임워크(최적화자와 평가자)는 대부분의 AutoML 접근법을 포괄하고 설계 지침을 제공할 수 있다.
- AutoML은 자동화되는 학습 과정(특징 공학, 모델 선택, 최적화 알고리즘 선택, NAS)으로 분류될 수 있고 기법에 따라 기본 대 숙련된 것으로 구분된다.
- NAS는 일반 프레임워크와 일치하면서도 구별되는 중요한 전체 범위 AutoML 사례로 인정된다.
- 본 설문은 문제 설정, 기법, 응용 및 이론 측면에서 향후 방향을 제시한다.
- 저자들은 AutoML 접근법을 설계하고 기존 방법과 통합하기 위한 가이드라인과 워크플로를 제공한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.