Skip to main content
QUICK REVIEW

[논문 리뷰] Energy Efficiency of Many-Soft-Core Processors

David Castells‐Rufas, Albert Saà-Garriga|arXiv (Cornell University)|2016. 01. 01.
Parallel Computing and Optimization Techniques참고 문헌 19인용 수 4
한 줄 요약

이 논문은 일반 목적의 다중처리 모델과 맞춤형 하드웨어 가속을 조합하여 극한의 에너지 효율성을 달성하는 재구성 가능한 다수의 소프트코어 FPGA 프로세서 아키텍처를 제안한다. 맞춤형 명령어로 최적화된 소프트코어 프로세서를 8코어로 확장함으로써 시스템은 1,623.39 MOPS/W의 에너지 효율을 달성하였으며, 이는 초저전력 CPU(i7-5500U)의 58배, 고성능 GPGPU(GK110-400)의 124배에 달한다. 이는 소프트코어 기반 시스템이 전용 가속기보다 에너지 효율성이 뛰어나면서도 프로그래머블성을 유지할 수 있음을 보여준다.

ABSTRACT

The growing capacity of integration allows to instantiate hundreds of soft-core processors in a single FPGA to create a reconfigurable multiprocessing system. Lately, FPGAs have been proven to give a higher energy efficiency than alternative platforms like CPUs and GPGPUs for certain workloads and are increasingly used in data-centers. In this paper we investigate whether many-soft-core processors can achieve similar levels of energy efficiency while providing a general purpose environment, more easily programmed, and allowing to run other applications without reconfiguring the device. With a simple application example we are able to create a reconfigurable multiprocessing system achieving an energy efficiency 58 times higher than a recent ultra-low-power processor and 124 times higher than a recent high performance GPGPU.

연구 동기 및 목표

  • 재구성 가능한 다수의 소프트코어 FPGA 시스템이 전용 가속기 수준의 높은 에너지 효율성을 달성하면서도 일반 목적의 프로그래머블성을 유지할 수 있는지 평가하기.
  • 소프트코어 프로세서와 하드웨어 가속 또는 GPGPU 기반 플랫폼 간의 에너지 효율성 트레이드오프를 조사하기.
  • 소프트코어에 맞춤형 하드웨어를 통합함으로써 재구성 가능한 스레드 수준 병렬 환경에서 성능과 에너지 효율성이 어떻게 크게 향상될 수 있는지 보여주기.
  • 일般 목적 워크로드에 대해 FPGA 상의 소프트코어 다중처리의 확장성과 효율성 한계를 탐색하기.

제안 방법

  • 저자들은 NIOSII 소프트코어 프로세서를 사용하여 FPGA 상에 재구성 가능한 다수의 소프트코어 시스템을 구현하였으며, 명령어 수준 병렬성 향상을 위해 맞춤형 명령어와 파ip라인드 논리를 통합하였다.
  • 스레드 수준 병렬성을 평가하기 위해 소수 검출 벤치마크에서 루프 수준 병렬화 전략을 적용하였다.
  • 시스템은 EP4SGX530 FPGA에 합성 및 구현되었으며, 다양한 스레드 수와 설계 구성에서 성능과 전력 소모를 측정하였다.
  • 에너지 효율성은 동적 전력 측정값과 하드웨어 실행 시간을 기반으로 계산되었으며, 운영량/와트(MOPS/W) 단위로 산정되었다.
  • OpenMP 스타일의 스레딩과 FPGA 재구성 가능성을 활용하여 표준 다중처리 프로그래밍 모델의 재사용을 가능하게 하였다.
  • 동일한 애플리케이션 커널을 사용하여 상업용 i7-5500U CPU 및 NVIDIA GK110-400 GPGPU와의 비교 벤치마크를 실시하였다.

실험 결과

연구 질문

  • RQ1다수의 소프트코어 FPGA 시스템은 전용 가속기(예: GPGPU) 수준의 에너지 효율성을 달성하면서도 일반 목적의 프로그래머블성과 재구성 가능성을 유지할 수 있는가?
  • RQ2코어 수 증가와 맞춤형 하드웨어 보완이 소프트코어 기반 다중처리 시스템의 에너지 효율성에 어떻게 영향을 미치는가?
  • RQ3소프트코어 프로세서를 사용할 경우 하드웨어 최적화 또는 고수준 합성(HLS) 플랫폼 대비 성능 및 에너지 효율성 트레이드오프는 어떠한가?
  • RQ4맞춤형 명령어와 파이프라인화가 다중처리 환경에서 소프트코어 프로세서의 에너지 효율성을 얼마나 향상시킬 수 있는가?
  • RQ5재구성 가능한 소프트코어 시스템이 일반 목적 워크로드에서 고성능 CPU보다 에너지 효율성이 뛰어나게 성능을 뛰어올 수 있는가?

주요 결과

  • 8코어 소프트코어 FPGA 시스템은 1,623.39 MOPS/W의 에너지 효율을 달성하였으며, 이는 i7-5500U의 최고 효율인 27.7 MOPS/W보다 58배 높은 수준이다.
  • 동일한 시스템은 NVIDIA GK110-400 GPGPU의 13.082 MOPS/W보다 124배 높은 에너지 효율을 기록하였다.
  • 소프트코어 시스템의 에너지 효율성은 스레드 수 증가에 따라 향상되었으며, 8개 스레드에서 최고 효율을 기록하였고, 거의 이상적인 스피드업 프로파일을 보였다.
  • 맞춤형 명령어와 파이프라인드 논리의 추가로 단일 코어 모드에서 에너지 효율성이 기준값 2.45 MOPS/W에서 파이프라인드 설계 시 611.27 MOPS/W로 향상되었다.
  • 인터커넥트 및 제어 논리의 전력 소모 증가에도 불구하고, 성능 향상이 전력 비용을 상쇄하여 다중처리 시스템은 높은 효율성을 유지하였다.
  • 결과적으로 소프트코어 기반 시스템이 일반 목적의 워크로드에서 일반 목적 CPU와 GPGPU를 모두 뛰어나는 에너지 효율성을 달성할 수 있으며, 동시에 완전한 프로그래머블성과 재구성 가능성을 유지할 수 있음을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.