QUICK REVIEW

[논문 리뷰] Surrogate Gradient Learning in Spiking Neural Networks

Emre Neftci, Hesham Mostafa|arXiv (Cornell University)|2019. 01. 28.

Advanced Memory and Neural Computing참고 문헌 40인용 수 149

한 줄 요약

본 논문은 스파이킹 신경망(SNN)의 학습을 검토하고, 비미분 가능 스파이킹 다이나믹스를 극복하기 위한 대리 기울기(surrogate gradient) 방법을 제안하며, SNN이 RNN으로 매핑되는 방식과 SGs가 효과적인 학습을 가능하게 하는 방법을 자세히 설명한다.

ABSTRACT

Spiking neural networks are nature's versatile solution to fault-tolerant and energy efficient signal processing. To translate these benefits into hardware, a growing number of neuromorphic spiking neural network processors attempt to emulate biological neural networks. These developments have created an imminent need for methods and tools to enable such systems to solve real-world signal processing problems. Like conventional neural networks, spiking neural networks can be trained on real, domain specific data. However, their training requires overcoming a number of challenges linked to their binary and dynamical nature. This article elucidates step-by-step the problems typically encountered when training spiking neural networks, and guides the reader through the key concepts of synaptic plasticity and data-driven learning in the spiking setting. To that end, it gives an overview of existing approaches and provides an introduction to surrogate gradient methods, specifically, as a particularly flexible and efficient method to overcome the aforementioned challenges.

연구 동기 및 목표

숨겨진 계층을 가진 깊은 스파이킹 신경망의 학습 도전 과제를 설명한다.
비미분 가능 스파이킹 비선형성에 대한 유연한 해결책으로서 대리 기울기 방법을 소개하고 분류한다.
SNN을 순환 신경망(RNN)으로 공학적으로 정식화하여 RNN의 학습 기술을 전달하는 방법을 보여준다.
뉴로모픽 혹은 하드웨어 지향 플랫폼에서의 학습 구현에 대한 실제적 고려사항을 논의한다.

제안 방법

스파이킹 LIF 뉴런을 전류 기반 시냅스와 함께 RCNN/RNN으로 동등하게 구성하여 학습 관점을 통합한다.
시냅스 전류 및 막 전위의 이산시간 동역학식(Equations 2–5)을 설명하고 이를 RNN 상태 업데이트와 연관시킨다.
RNN의 학습 방법(BP/Backpropagation Through Time, forward 방법, locality)을 검토하고 이를 SNN에 매핑한다.
스파이킹 비선형성의 비미분 가능성을 다루기 위해 surrogate gradient(SG) 접근법을 도입하고, SG가 표준 그래디언트 기반 방법과 결합되는 방법을 제시한다.
연마된 접근방식(소프트/비선형 모델, 확률적 모델, 레이트 코딩, 단일 스파이크 타이밍)과 SG 기반 접근의 차이를 구분한다.
SG가 다양한 코딩 체계(레이트, 타이밍)와 전체 BPTT가 비현실적인 하드웨어 제약에 맞춰 적응될 수 있음을 요약한다.

실험 결과

연구 질문

RQ1깊은 SNN에서 숨겨진 계층을 가진 학습의 주요 도전 과제는 무엇인가?
RQ2대리 기울기 방법이 비미분 가능 스파이킹 비선형성에 어떻게 대응하여 SNN에서 그래디언트 기반 학습을 가능하게 하는가?
RQ3SNN을 BPTT나 forward 방법과 같은 RNN 기반 기법을 사용해 어떻게 효과적으로 학습시킬 수 있는가?
RQ4SG 방법의 하드웨어 구현 및 로컬 학습 규칙에 대한 실질적 시사점은 무엇인가?

주요 결과

SNN은 RNN의 한 형태로 간주될 수 있어, RNN에서 SNN으로 그래디언트 기반 학습 기술의 전달이 가능하다.
대리 기울기 방법은 스파이킹 비선형성에 대한 연속적이고 미분 가능한 근사를 제공하여 효과적인 그래디언트 기반 최적화를 가능하게 한다.
SG는 전통적인 역전파(BPTT)나 forward 방법과 함께 사용할 수 있으며, 적합성 추적(eligibility traces)을 포함하여 SNN을 학습시킬 수 있다.
연마 기반 접근과 SG 기반 접근을 비교하면, 정확한 대리 함수의 선택보다 유용한 그래디언트 신호를 유지하는 것이 더 중요하다.
SG 기법은 다양한 코딩 체계(레이트, 타이밍)를 수용하며 전체 BPTT가 비현실적인 하드웨어 제약에 맞춰 조정될 수 있다.
문헌 조사는 다양한 대리 도함수(piecewise linear, fast sigmoid, exponential)의 범위를 다루며 이를 RCNN 및 깊은 SNN에 성공적으로 적용했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.