Skip to main content
QUICK REVIEW

[논문 리뷰] ShiftAddNet: A Hardware-Inspired Deep Network

Haoran You, Xiaohan Chen|arXiv (Cornell University)|2020. 10. 24.
Advanced Neural Network Applications참고 문헌 47인용 수 37
한 줄 요약

ShiftAddNet은 곱셈을 대체하기 위해 비트 시프트와 덧셈 계층만 사용하여 DNN을 재정의하고, 표준 네트워크와 비슷한 정확도에 대해 에너지 효율적인 학습 및 추론을 가능하게 한다. FPGA 기반 측정은 성능을 유지하면서 에너지 절감이 크게 있음을 보여준다.

ABSTRACT

Multiplication (e.g., convolution) is arguably a cornerstone of modern deep neural networks (DNNs). However, intensive multiplications cause expensive resource costs that challenge DNNs' deployment on resource-constrained edge devices, driving several attempts for multiplication-less deep networks. This paper presented ShiftAddNet, whose main inspiration is drawn from a common practice in energy-efficient hardware implementation, that is, multiplication can be instead performed with additions and logical bit-shifts. We leverage this idea to explicitly parameterize deep networks in this way, yielding a new type of deep network that involves only bit-shift and additive weight layers. This hardware-inspired ShiftAddNet immediately leads to both energy-efficient inference and training, without compromising the expressive capacity compared to standard DNNs. The two complementary operation types (bit-shift and add) additionally enable finer-grained control of the model's learning capacity, leading to more flexible trade-off between accuracy and (training) efficiency, as well as improved robustness to quantization and pruning. We conduct extensive experiments and ablation studies, all backed up by our FPGA-based ShiftAddNet implementation and energy measurements. Compared to existing DNNs or other multiplication-less models, ShiftAddNet aggressively reduces over 80% hardware-quantified energy cost of DNNs training and inference, while offering comparable or better accuracies. Codes and pre-trained models are available at https://github.com/RICE-EIC/ShiftAddNet.

연구 동기 및 목표

  • 하드웨어 설계 원리(시프트와 덧셈)에 따른 곱셈 없는 심층 네트워크를 제시하여 에너지 소비를 줄인다.
  • 표현력을 유지하고 표준 DNN처럼 학습 가능한 두 계층 패러다임(비트 시프트와 덧셈)을 개발한다.
  • ShiftAddNet의 학습 및 추론 알고리즘을 실제 하드웨어 구현 및 에너지 측정과 함께 입증한다.
  • 정밀도 감소 및 가지치기에서의 정확도와 학습 효율성 간의 트레이드 오프를 정량화한다.

제안 방법

  • 합성곱(convolution) 및 완전연결층을 비트 시프트 및 덧셈의 두 곱셈 없는 계층으로 대체하여 표준 신경망을 재매개변수화한다.
  • 시프트와 덧셈 연산을 결합하는 ShiftAddNet 파이프라인을 형식화하여 표현 용량을 보존한다.
  • 시프트 및 덧셈 계층의 역전파 규칙을 도출하고 가중치 업데이트와 그래디언트 흐름을 포함한다.
  • 고정 시프트 계층을 활용한 변형을 제안하여 거칠고 세밀한 학습 및 에너지 절감을 탐구한다.
  • Zynq FPGA에서 ShiftAddNet을 구현하고 AdderNet, DeepShift, ConvNet과 비교하여 에너지 소비와 정확도를 평가한다.

실험 결과

연구 질문

  • RQ1비트 시프트와 덧셈 계층의 하드웨어에서 영감을 받은 조합이 표준 DNN의 표현력을 크게 유지하면서 곱셈을 크게 줄일 수 있는가?
  • RQ2시프트와 애드 계층은 양자화나 가지치기에서의 정확도와 학습/추론 에너지에 어떤 trade-off를 보이는가?
  • RQ3시프트 계층을 고정하거나 덧셈 계층을 희소화하면 에너지 효율이 개선되면서도 정확도가 유지되는가?
  • RQ4실제 하드웨어(FPGA)에 ShiftAddNet을 배치할 때 기존의 곱셈 없는 모델에 비해 실질적 이점은 무엇인가?

주요 결과

  • ShiftAddNet은 곱셈 기반 네트워크 및 기존의 곱셈 없는 모델에 비해 동등하거나 더 나은 정확도로 에너지 효율적인 추론 및 학습을 달성한다.
  • 고정 시프트 계층은 정확도를 희생하지 않으면서도 상당한 에너지 절감을 제공하며 일부 설정에서 양자화에 대한 강건성을 개선할 수 있다.
  • ShiftAddNet은 AdderNet 및 DeepShift에 비해 여러 벤치마크에서 양자화 및 가지치기에 대한 강건성이 향상된다.
  • FPGA 구현은 학습 및 추론의 에너지 비용을 크게 줄이는 실측치를 제공하며 성능을 유지한다.
  • 하이브리드 시프트-앗 디자인은 시프트만 또는 덧셈만 접근법보다 더 높은 표현 용량을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.