Skip to main content
QUICK REVIEW

[논문 리뷰] Theano-based Large-Scale Visual Recognition with Multiple GPUs

Wei‐Guang Ding, Ruoyan Wang|arXiv (Cornell University)|2014. 01. 01.
Advanced Image and Video Retrieval Techniques참고 문헌 8인용 수 5
한 줄 요약

이 논문은 단일 GPU에서 Caffe와 유사한 성능을 달성하는, 다중 GPU에 걸쳐 단순 데이터 병렬 처리를 사용한 첫 번째 오픈소스 Theano 기반 AlexNet의 구현을 제시한다. 이 방법은 파이썬 기반 딥러닝을 사용한 대규모 시각 인식과 효율적인 다중 GPU 학습을 가능하게 한다.

ABSTRACT

In this report, we describe a Theano-based AlexNet (Krizhevsky et al., 2012) implementation and its naive data parallelism on multiple GPUs. Our performance on 2 GPUs is comparable with the state-of-art Caffe library (Jia et al., 2014) run on 1 GPU. To the best of our knowledge, this is the first open-source Python-based AlexNet implementation to-date.

연구 동기 및 목표

  • 대규모 시각 인식을 위한 Theano 기반 AlexNet의 구현을 목적으로 한다.
  • 단순 데이터 병렬 처리를 사용한 효율적인 다중 GPU 학습을 가능하게 한다.
  • 기존의 Caffe 기반 구현에 대체할 수 있는 오픈소스이자 파이썬 기반의 대안을 제공한다.
  • 다중 GPU를 사용할 때 최신 프레임워크 수준의 경쟁력 있는 성능을 입증한다.

제안 방법

  • 저자들은 Theano 딥러닝 프레임워크를 사용하여 AlexNet을 구현했다.
  • 배치를 두 개의 GPU에 나누어 단순 데이터 병렬 처리를 적용했다.
  • 각 GPU는 공유된 모델 파라미터를 사용하여 입력 데이터의 부분 집합을 독립적으로 처리한다.
  • 각 GPU 간에 전방 및 역방향 전파 후에 모델 파라미터를 동기화한다.
  • 학습 파이프라인이 완전히 미분 가능하며 표준 역전파를 사용해 최적화된다.
  • 재현 가능성과 향후 연구를 지원하기 위해 구현을 오픈소스로 공개한다.

실험 결과

연구 질문

  • RQ1Theano 기반의 AlexNet 구현이 Caffe와 같은 최신 프레임워크 수준의 성능을 달성할 수 있는가?
  • RQ2두 개의 GPU에서 AlexNet을 학습하는 데 단순 데이터 병렬 처리가 얼마나 효과적인가?
  • RQ3파이썬 기반 딥러닝 프레임워크가 최적화된 C++ 프레임워크 수준의 성능을 달성할 수 있는가?
  • RQ4이 방법을 사용한 다중 GPU 학습의 확장성과 효율성은 어떠한가?

주요 결과

  • 두 개의 GPU를 사용한 Theano 기반 AlexNet 구현은 단일 GPU에서 실행되는 Caffe와 유사한 성능을 달성한다.
  • 이 구현은 다중 GPU 지원을 하는 첫 번째 오픈소스 파이썬 기반 AlexNet이다.
  • 단순 데이터 병렬 처리는 유의미한 오버헤드 없이 두 개의 GPU에 걸쳐 학습을 효과적으로 확장한다.
  • 이 프레임워크는 완전한 재현 가능성과 확장성을 갖춘 대규모 시각 인식을 가능하게 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.