Skip to main content
QUICK REVIEW

[論文レビュー] A Survey on Deep Learning Hardware Accelerators for Heterogeneous HPC Platforms

Cristina Silvano, Daniele Ielmini|arXiv (Cornell University)|Jun 27, 2023
Advanced Memory and Neural Computing被引用数 30
ひとこと要約

このサーベイは、GPU、TPU、FPGA/ASIC NPU、オープンハードウェア RISC-V コプロセッサ、そして新興のメモリと計算パラダイムをカバーする異種HPCプラットフォーム向けの最新ディープラーニングアクセラレータを調査・分類します。アーキテクチャ、技術、将来の課題を統合的に整理した視点を提供します。

ABSTRACT

Recent trends in deep learning (DL) have made hardware accelerators essential for various high-performance computing (HPC) applications, including image classification, computer vision, and speech recognition. This survey summarizes and classifies the most recent developments in DL accelerators, focusing on their role in meeting the performance demands of HPC applications. We explore cutting-edge approaches to DL acceleration, covering not only GPU- and TPU-based platforms but also specialized hardware such as FPGA- and ASIC-based accelerators, Neural Processing Units, open hardware RISC-V-based accelerators, and co-processors. This survey also describes accelerators leveraging emerging memory technologies and computing paradigms, including 3D-stacked Processor-In-Memory, non-volatile memories like Resistive RAM and Phase Change Memories used for in-memory computing, as well as Neuromorphic Processing Units, and Multi-Chip Module-based accelerators. Furthermore, we provide insights into emerging quantum-based accelerators and photonics. Finally, this survey categorizes the most influential architectures and technologies from recent years, offering readers a comprehensive perspective on the rapidly evolving field of deep learning acceleration.

研究の動機と目的

  • HPC向けの影響力のあるDLアクセラレータアーキテクチャの網羅的な概要を提供する。
  • ハードウェアタイプ、メモリ技術、計算パラダイムでアクセラレータを分類し、類似点と相違点を浮き彫りにする。
  • DLアクセラレータのエネルギーと性能に影響を与えるデータフローとメモリ再利用戦略を解説する。
  • DLアクセラレータ研究の新興技術と将来の課題を要約する。
  • DLワークロードを扱うHPCシステムを設計する研究者と実務者のための参照点を提供する。

提案手法

  • 代表的な特徴を用いてアクセラレータを分類し、アーキテクチャを比較する。
  • DL加速に関する約230件の論文のレビューと参照を行う。
  • GPU、TPU、FPGA、ASIC NPU、RISC-Vオープンハードウェアアクセラレータ、およびコプロセッサを含む。
  • 3D-stacked PIM、非揮発性メモリ(RRAM/PCM)、ニューロモルフィック・ユニット、マルチチップモジュールなどの新興パラダイムを説明する。
  • 量子アクセラレータと光子技術を含む将来の動向を論じる。

実験結果

リサーチクエスチョン

  • RQ1HPCワークロードのためのDL加速を可能にする最も影響力のあるアーキテクチャと技術は何か?
  • RQ2GPU/TPU、FPGA/ASIC NPU、オープンハードウェアアクセラレータは、DLタスクにおける性能、エネルギー効率、柔軟性の観点からどのように比較できるか?
  • RQ3新興メモリ技術と計算パラダイム(例: PIM、RRAM/PCM、ニューロモルフィック)のDL加速における役割は何か?
  • RQ4異種HPCプラットフォーム上のDLアクセラレータの主要な課題と今後の方向性は何か?
  • RQ5研究者と実務者にはっきりとした観点を提供するために、DLアクセラレータはどのように整理・分類できるか?

主な発見

  • DLアクセラレータはGPU、TPU、FPGA、ASIC NPU、オープンハードウェアRISC-Vコプロセッサ、およびメモリ/処理パラダイムにまたがる。
  • 新興技術には3D-stacked PIM、RRAM、PCM、Neuromorphic Processing Units、およびMulti-Chip Modulesが含まれる。
  • 本調査はDL加速に関する約230件の研究を分析・参照して、総合的な視点を提供する。
  • DL workloads向けの量子アクセラレータと光子技術など、将来の課題を論じる。
  • 体系的な分類はアーキテクチャを比較し、速度、エネルギー、柔軟性のトレードオフを特定するのに役立つ。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。