Skip to main content
QUICK REVIEW

[논문 리뷰] FlashAbacus: A Self-Governing Flash-Based Accelerator for Low-Power Systems

Jie Zhang, Myoungsoo Jung|arXiv (Cornell University)|2018. 05. 08.
Advanced Data Storage Technologies참고 문헌 63인용 수 4
한 줄 요약

FlashAbacus는 여러 개의 플래시 모듈과 경량 멀티프로세서를 통합하여 플래시 메모리 근처에서 직접이고 저에너지 커널 실행 및 데이터 접근을 가능하게 하는 자기주도형 플래시 기반 가속기이다. 커스터마이즈된 Flashvisor 추상화를 통해 호스트 파일 시스템과 I/O 라이브러리에 대한 의존도를 제거함으로써, 기존 외부 스토리지 접근 방식을 사용하는 이종 컴퓨팅 대비 대역폭은 127% 향상되고 에너지 소비는 78.4% 감소한다.

ABSTRACT

Energy efficiency and computing flexibility are some of the primary design constraints of heterogeneous computing. In this paper, we present FlashAbacus, a data-processing accelerator that self-governs heterogeneous kernel executions and data storage accesses by integrating many flash modules in lightweight multiprocessors. The proposed accelerator can simultaneously process data from different applications with diverse types of operational functions, and it allows multiple kernels to directly access flash without the assistance of a host-level file system or an I/O runtime library. We prototype FlashAbacus on a multicore-based PCIe platform that connects to FPGA-based flash controllers with a 20 nm node process. The evaluation results show that FlashAbacus can improve the bandwidth of data processing by 127%, while reducing energy consumption by 78.4%, as compared to a conventional method of heterogeneous computing. \blfootnote{This paper is accepted by and will be published at 2018 EuroSys. This document is presented to ensure timely dissemination of scholarly and technical work.

연구 동기 및 목표

  • 저전력 이종 가속기에서 외부 스토리지 접근으로 인한 높은 에너지 비용과 성능 저하 문제를 해결하기 위해.
  • 기존 가속기의 한계를 극복하기 위해 플래시 접근을 위해 호스트 측 파일 시스템과 I/O 라이브러리에 의존하는 방식을 탈피하기 위해.
  • 단일 가속기 플랫폼 내에서 플래시 메모리에 직접적으로 효율적이고 안전한 다중 커널 실행을 가능하게 하기 위해.
  • 최소한의 하드웨어 및 소프트웨어 오버헤드로 처리와 스토리지의 공재를 통해 에너지 효율성과 시스템 대역폭을 향상시키기 위해.
  • 외부 운영체제나 런타임 지원 없이도 동적으로 커널을 스케줄링하고 플래시 접근을 관리할 수 있는 자기주도형 가속기 설계를 위해.

제안 방법

  • 수십 개의 플래시 모듈과 경량 멀티프로세서를 통합하여 저전력 데이터 처리 단위를 하나의 단위로 구성한다.
  • 커스터마이즈된 가상화 레이어인 Flashvisor를 활용하여 지정된 커널 데이터 섹션을 지정된 플래시 메모리에 직접 매핑하며, 지시 세트 아키텍처를 수정하지 않는다.
  • 플래시에 동시 다중 커널 접근 시 데이터 일관성 손상을 방지하기 위해 범위 잠금 메커니즘을 사용한다.
  • 주요 처리 코어에서 플래시 관리 작업(예: 웨어 레벨링, 쓰레기 수거)을 별도의 프로세서로 이관하여 코어 오버헤드를 감소시킨다.
  • 데이터 병렬성을 탐지하고 활용함으로써 커널 간에 독립적인 코드 블록의 순서를 뒤바꿔 실행할 수 있도록 한다.
  • 20nm 플래시 컨트롤러를 사용하여 PCIe 기반 FPGA 플랫폼에 가속기를 구현하고, 실제 성능을 프로토타이핑 및 평가한다.

실험 결과

연구 질문

  • RQ1자기주도형 가속기가 플래시 기반 데이터 처리에서 호스트 수준의 파일 시스템과 I/O 라이브러리가 필요 없도록 할 수 있는가?
  • RQ2플래시 메모리에서 다중 커널 실행을 효율적으로 스케줄링하고 격리함으로써 자원 활용도를 극대화하고 에너지 소비를 최소화할 수 있는가?
  • RQ3가상화 레이어를 통한 직접 플래시 접근이 기존 외부 스토리지 접근 방식에 비해 대역폭 향상과 에너지 절감에 얼마나 기여할 수 있는가?
  • RQ4기존 운영체제 없이 가속기 내부에서 플래시 펌웨어를 관리할 경우 발생하는 성능 및 에너지 오버헤드는 어느 정도인가?
  • RQ5경량 FPGA 기반 가속기가 외부 SSD를 탑재한 기존의 멀티코어 가속기와 비교해 성능 및 에너지 효율성에서 유사하거나 우수한 성능을 달성할 수 있는가?

주요 결과

  • FlashAbacus는 외부 스토리지 접근을 사용하는 기존 이종 컴퓨팅 대비 데이터 처리 대역폭을 127% 향상시켰다.
  • 기본 방법 대비 에너지 소비를 78.4% 감소시켜 에너지 효율성 향상에 상당한 기여를 했다.
  • 플래시에서 직접 커널 실행 및 데이터 접근을 가능하게 함으로써 총 실행 시간의 49%와 총 시스템 에너지의 85%를 데이터 전송에 소비하는 것을 제거했다.
  • Flashvisor 추상화는 지시 세트 아키텍처를 수정하지 않거나 호스트 측 스토리지 스택에 의존하지 않고도 플래시 메모리에 직접적이고 안전하며 효율적인 접근을 가능하게 했다.
  • 20nm 플래시 컨트롤러를 탑재한 PCIe 기반 FPGA 플랫폼에 구현된 프로토타입은 자기주도 설계의 실현 가능성과 성능 이점을 확인했다.
  • 처리와 스토리지를 공재함으로써 데이터 이동을 최소화하고 다중 커널에 대한 동적이고 종속성 인식 스케줄링을 가능하게 하여 높은 성능과 저에너지 소비를 달성했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.