[논문 리뷰] Accelerating Diffusion Models for Generative AI Applications with Silicon Photonics
이 논문은 확산 모델용 실리콘 포토닉스 기반 가속기를 제안하며, 최첨단 가속기에 비해 최소 3배의 에너지 효율성과 5.5배의 처리량 향상을 달성한다.
Diffusion models have revolutionized generative AI, with their inherent capacity to generate highly realistic state-of-the-art synthetic data. However, these models employ an iterative denoising process over computationally intensive layers such as UNets and attention mechanisms. This results in high inference energy on conventional electronic platforms, and thus, there is an emerging need to accelerate these models in a sustainable manner. To address this challenge, we present a novel silicon photonics-based accelerator for diffusion models. Experimental evaluations demonstrate that our photonic accelerator achieves at least 3x better energy efficiency and 5.5x throughput improvement compared to state-of-the-art diffusion model accelerators.
연구 동기 및 목표
- 확산 모델에서 반복적 잡음 제거 과정으로 인해 생성 AI에 사용되는 확산 모델의 지속 가능한 가속화를 동기화한다.
- 확산 모델 추론을 위해 기존 전자 플랫폼을 대체할 수 있는 실리콘 포토닉스 기반 가속기를 제안한다.
- 제안된 가속기를 최첨단 확산 모델 가속기와 비교하여 에너지 효율성 및 처리량 향상을 정량적으로 평가한다.
제안 방법
- 확산 모델 추론에 맞춘 실리콘 포토닉스 기반 가속기를 도입한다.
- 확산 과정 내부의 UNets 및 주의 메커니즘 등 연산 계층을 다룬다.
- 최첨단 가속기와의 에너지 효율성 및 처리량을 비교하여 이득을 입증한다.
- 성능 향상을 정량화하기 위한 실험적 평가(에너지 및 처리량)를 활용한다.
실험 결과
연구 질문
- RQ1실리콘 포토닉스가 확산 모델의 반복적인 잡음 제거 단계를 효과적으로 가속할 수 있는가?
- RQ2 photonic 가속기의 에너지 효율성 및 처리량 이점은 전자 확산 모델 가속기에 비해 어떠한가?
- RQ3제안된 가속기가 UNets 및 주의와 같은 핵심 확산 모델 구성요소를 어떻게 처리하는가?
- RQ4실험적 평가가 실제 워크로드에서 주장된 개선을 보여주는가?
주요 결과
- 광자 가속기가 최첨단 확산 모델 가속기에 비해 최소 3배의 에너지 효율을 달성한다.
- 광자 가속기가 최첨단 확산 모델 가속기에 비해 약 5.5배의 처리량 향상을 달성한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.