Skip to main content
QUICK REVIEW

[論文レビュー] Energy Efficiency of Many-Soft-Core Processors

David Castells‐Rufas, Albert Saà-Garriga|arXiv (Cornell University)|Jan 1, 2016
Parallel Computing and Optimization Techniques参考文献 19被引用数 4
ひとこと要約

本稿では、カスタムハードウェアアクセラレーションと汎用並列処理モデルを組み合わせることで、極めて高いエネルギー効率を達成する再構成可能で多数のソフトコアを搭載したFPGAプロセッサアーキテクチャを提案する。カスタム命令によるソフトコアプロセッサの最適化と8コアへのスケーリングにより、1,623.39 MOPS/Wのエネルギー効率を達成し、超低消費電力CPU(i7-5500U)の58倍、高性能GPGPU(GK110-400)の124倍も高い。これは、ソフトコアベースのシステムが、プログラマビリティを維持したまま、専用アクセラレータを上回るエネルギー効率を実現できることを示している。

ABSTRACT

The growing capacity of integration allows to instantiate hundreds of soft-core processors in a single FPGA to create a reconfigurable multiprocessing system. Lately, FPGAs have been proven to give a higher energy efficiency than alternative platforms like CPUs and GPGPUs for certain workloads and are increasingly used in data-centers. In this paper we investigate whether many-soft-core processors can achieve similar levels of energy efficiency while providing a general purpose environment, more easily programmed, and allowing to run other applications without reconfiguring the device. With a simple application example we are able to create a reconfigurable multiprocessing system achieving an energy efficiency 58 times higher than a recent ultra-low-power processor and 124 times higher than a recent high performance GPGPU.

研究の動機と目的

  • 多数のソフトコアを搭載したFPGAシステムが、専用アクセラレータと同等のエネルギー効率を達成しつつ、汎用的で再構成可能なプログラミングを維持できるかどうかを評価すること。
  • ソフトコアプロセッサとハードウェアアクセラーテッド、またはGPGPUベースのプラットフォームとの間で、エネルギー効率のトレードオフを調査すること。
  • ソフトコアにカスタムハードウェアを追加することで、再構成可能でスレッドレベル並列処理が可能な環境において、性能とエネルギー効率を顕著に向上させられることを実証すること。
  • 一般作業負荷を対象としたFPGA上でのソフトコア並列処理のスケーラビリティと効率の限界を調査すること。

提案手法

  • 著者は、カスタム命令とパイプラインドロジックを追加することで、命令レベル並列性を向上させたNIOSIIソフトコアプロセッサを用いて、再構成可能な多数のソフトコアシステムをFPGA上に実装した。
  • 複数コア間でのスレッドレベル並列処理の評価のために、素数検出ベンチマークを用いてループレベル並列化戦略を適用した。
  • システムはEP4SGX530 FPGAに合成・デプロイされ、スレッド数や設計構成を変更した状態で、性能と消費電力を測定した。
  • エネルギー効率は、動的消費電力測定値とハードウェア実行時間から算出した操作数/秒・ワット(MOPS/W)として計算した。
  • OpenMP風のスレーディングとFPGAの再構成性を活用し、標準的な並列プログラミングモデルの再利用を可能にした。
  • 同じアプリケーションカーネルを用いて、商用のi7-5500U CPUおよびNVIDIA GK110-400 GPGPUと比較ベンチマークを実施した。

実験結果

リサーチクエスチョン

  • RQ1多数のソフトコアFPGAシステムは、GPGPUのような専用アクセラレータと同等のエネルギー効率を達成しつつ、汎用的かつ再構成可能であると言えるか?
  • RQ2コア数の増加とカスタムハードウェア拡張を加えた場合、ソフトコアベースの並列処理システムのエネルギー効率はどのように変化するか?
  • RQ3ソフトコアプロセッサとハードウェア最適化またはハイレベル合成(HLS)プラットフォームを比較した場合、性能とエネルギー効率のトレードオフはどのようなものか?
  • RQ4カスタム命令とパイプライン処理を導入することで、マルチプロセッサ環境下のソフトコアプロセッサのエネルギー効率はどの程度向上するか?
  • RQ5再構成可能なソフトコアシステムは、一般作業負荷において、高性能CPUをエネルギー効率の面で上回ることができるか?

主な発見

  • 8コアのソフトコアFPGAシステムは、エネルギー効率1,623.39 MOPS/Wを達成し、i7-5500Uのピーク効率27.7 MOPS/Wの58倍も高い。
  • 同じシステムは、NVIDIA GK110-400 GPGPUのエネルギー効率13.082 MOPS/Wを124倍も上回った。
  • ソフトコアシステムのエネルギー効率はスレッド数の増加に伴い向上し、8スレッドでピークに達し、ほぼ理想に近いスループット向上を示した。
  • カスタム命令とパイプラインドロジックの追加により、単一コアモードでのエネルギー効率は、ベースラインの2.45 MOPS/Wから、パイプライン設計の611.27 MOPS/Wに向上した。
  • インタコネクトおよび制御論理の消費電力増加にもかかわらず、マルチプロセッサシステムは高い効率を維持した。これは、性能の向上が消費電力の増加を上回ったからである。
  • 結果として、ソフトコアベースのシステムが、汎用CPUおよびGPGPUを上回るエネルギー効率を達成できることを示した。同時に、完全なプログラマビリティと再構成可能性を維持している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。