Skip to main content
QUICK REVIEW

[논문 리뷰] Tune: A Research Platform for Distributed Model Selection and Training

Richard Liaw, Eric Liang|arXiv (Cornell University)|2018. 07. 13.
Machine Learning and Data Classification참고 문헌 11인용 수 615
한 줄 요약

Tune은 Ray 위에 다양한 하이퍼파라미터 탐색 알고리즘의 쉬운 통합을 가능하게 하는 분산 모델 선택과 학습을 위한 통합된 오픈 소스 API 및 스케줄링 프레임워크를 제공합니다. 이는 검색 로직으로부터 학습 스크립트를 분리하여 클러스터 전반의 실험 규모 확장을 가능하게 합니다.

ABSTRACT

Modern machine learning algorithms are increasingly computationally demanding, requiring specialized hardware and distributed computation to achieve high performance in a reasonable time frame. Many hyperparameter search algorithms have been proposed for improving the efficiency of model selection, however their adaptation to the distributed compute environment is often ad-hoc. We propose Tune, a unified framework for model selection and training that provides a narrow-waist interface between training scripts and search algorithms. We show that this interface meets the requirements for a broad range of hyperparameter search algorithms, allows straightforward scaling of search to large clusters, and simplifies algorithm implementation. We demonstrate the implementation of several state-of-the-art hyperparameter search algorithms in Tune. Tune is available at http://ray.readthedocs.io/en/latest/tune.html.

연구 동기 및 목표

  • 스케일 가능한 재현 가능한 분산 모델 선택 및 학습의 필요성을 동기 부여한다.
  • Tune을 학습 스크립트와 하이퍼파라미터 탐색 알고리즘 사이의 좁은 연결(API)으로 소개한다.
  • Tune이 광범위한 탐색 전략과 프레임워크 간의 손쉬운 통합을 가능하게 함을 시연한다.

제안 방법

  • 두 가지 API 설계를 제안한다: 학습 스크립트를 위한 사용자 API와 탐색 알고리즘을 위한 스케줄링 API.
  • 학습 중 Tune과 상호 작용하기 위한 협력 제어 모델 또는 직관적인 트랙 제어를 구현한다.
  • 병렬 실험을 관리하기 위한 on_result 및 choose_trial_to_run이 있는 TrialScheduler 인터페이스를 제공한다.
  • Ray 프레임워크를 기반으로 분산 실행, 리소스 관리 및 트라이얼 간 데이터 처리를 처리한다.
  • Async HyperBand, HyperBand, Median Stopping Rule, HyperOpt, Population-Based Training 등을 포함한 다수의 최첨단 하이퍼파라미터 탐색 알고리즘을 구현하거나 통합한다.
  • 초기 실험 구성 정의를 위한 최소 예제 및 도메인 특화 DSL을 제공한다.]
  • research_questions:[

실험 결과

연구 질문

  • RQ1Tune이 하나의 일반 API로 광범위한 하이퍼파라미터 최적화 알고리즘을 지원할 수 있는가?
  • RQ2Ray 기반 구현이 많은 동시 실험의 확장 가능한 분산 실행을 가능하게 하는가?
  • RQ3중간 트라이얼 결과를 효과적으로 사용하여 동적 스케줄링 결정 및 하이퍼파라미터 적응을 수행할 수 있는가?
  • RQ4사용자 경험이 기존 학습 스크립트에 쉽게 통합되면서 재현성을 보존하기에 충분히 간단한가?
  • RQ5Tune이 AutoML 실험을 서로 다른 스케줄러 간에 재현성, 시각화 및 비교를 어떻게 촉진하는가?

주요 결과

  • Tune은 다양한 하이퍼파라미터 탐색 알고리즘의 쉬운 통합을 가능하게 하는 좁은 허리의 사용자 및 스케줄링 API를 제공한다.
  • 프레임워크는 불규칙하고 이질적인 트라이얼 워크로드와 중간 결과 기반의 스케줄링 결정을 지원한다.
  • Tune에는 비동기 HyperBand, HyperBand, Median Stopping Rule, HyperOpt, Population-Based Training 등 여러 알고리즘이 구현되거나 통합되어 있다.
  • 트라이얼은 Ray 작업/액터로 실행되며 Ray를 통한 리소스 관리 및 데이터 처리를 통해 중첩된 분산 계산을 가능하게 한다.
  • Tune은 그리드/검색 구성을 위한 최소 예제와 DSL을 제공하고 콘솔 및 TensorBoard 통합을 통해 진행 상황을 로깅한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.