QUICK REVIEW

[논문 리뷰] Massively Distributed SGD: ImageNet/ResNet-50 Training in a Flash

Hiroaki Mikami, Hisahiro Suganuma|arXiv (Cornell University)|2018. 11. 13.

Advanced Neural Network Applications참고 문헌 16인용 수 73

한 줄 요약

본 논문은 배치 크기 제어, 라벨 스무딩, 2D-Torus all-reduce를 활용하여 ImageNet/ResNet-50을 대규모로 학습시키는 것을 보여주며, Neural Network Libraries (NNL)로 ABCI 클러스터에서 122초 학습을 달성한다.

ABSTRACT

Scaling the distributed deep learning to a massive GPU cluster level is challenging due to the instability of the large mini-batch training and the overhead of the gradient synchronization. We address the instability of the large mini-batch training with batch-size control and label smoothing. We address the overhead of the gradient synchronization with 2D-Torus all-reduce. Specifically, 2D-Torus all-reduce arranges GPUs in a logical 2D grid and performs a series of collective operation in different orientations. These two techniques are implemented with Neural Network Libraries (NNL). We have successfully trained ImageNet/ResNet-50 in 122 seconds without significant accuracy loss on ABCI cluster.

연구 동기 및 목표

대규모 미니배치 학습의 불안정성 해결.
대규모 GPU 클러스터에서 그래디언트 동기화 오버헤드 감소.
빠르고 확장 가능한 CNN 학습을 가능하게 하는 실용적 기술 제안.
대규모 클러스터에서 ImageNet/ResNet-50 학습의 고속성 시연.

제안 방법

대규모 미니배치 학습의 안정화를 위해 배치 크기 제어를 사용.
대규모 배치에서 일반화 능력을 향상시키기 위해 라벨 스무딩을 적용.
2D 격자에서의 GPUs를 조직하여 집합 연산을 효율적으로 수행하는 2D-Torus all-reduce를 구현.
위 기술들을 구현하기 위해 Neural Network Libraries (NNL)를 활용.
ResNet-50 아키텍처를 가진 ImageNet에서 평가.
ABCI 클러스터에서 학습 시간 및 정확도 영향 보고.

실험 결과

연구 질문

RQ1대규모에서 분산 SGD를 위한 대규모 미니배치 학습의 안정화 방법은 무엇인가?
RQ2대규모 GPU 클러스터에서 그래디언트 동기화 오버헤드를 효과적으로 감소시킬 수 있는가?
RQ3제안된 기술로 ImageNet/ResNet-50 학습에서 어떤 성능 향상을 얻을 수 있는가?
RQ4분산 설정에서 배치 크기 제어와 라벨 스무딩을 적용할 때 속도와 정확도 간의 트레이드오프는 무엇인가?

주요 결과

ABCI 클러스터에서 122초 만에 ImageNet/ResNet-50 학습이 가능하고, 정확도 손실은 크지 않다.
배치 크기 제어와 라벨 스무딩이 매우 큰 미니배치로 인한 불안정을 완화한다.
2D-Torus all-reduce가 2D 격자에서의 집합 연산으로 그래디언트 동기화 오버헤드를 줄인다.
Neural Network Libraries (NNL)에서의 기법 구현으로 확장 가능한 분산 SGD가 가능하다.
대 규모에서 실용적인 대규모 CNN 학습 경로를 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.