QUICK REVIEW

[논문 리뷰] Bio-Inspired Digit Recognition Using Spike-Timing-Dependent Plasticity (STDP) and Reward-Modulated STDP in Deep Convolutional Networks

Milad Mozafari, ‎Mohammad Ganjtabesh|arXiv (Cornell University)|2018. 03. 31.

Advanced Memory and Neural Computing인용 수 5

한 줄 요약

이 논문은 하위층에서 스파ike-타이밍 의존 성숙성(STDP)과 상위층에서 보상 조절 STDP(R-STDP)를 사용하는 생물학적으로 영감을 받은 딥 컨volution스피킹 신경망(DCSNN)을 제안한다. 이는 백프로파게이션 없이 에너지 효율적인 숫자 인식을 가능하게 하며, 과제 구분 특징을 학습하면서 관련이 없는 특징을 기각한다. MNIST에서 97.2%의 정확도를 달성하여 생물학적으로 타당하고 하드웨어 우호적인 솔루션을 제공한다.

ABSTRACT

The primate visual system has inspired the development of deep artificial neural networks, which have revolutionized the computer vision domain. Yet these networks are much less energy-efficient than their biological counterparts, and they are typically trained with backpropagation, which is extremely data-hungry. To address these limitations, we used a deep convolutional spiking neural network (DCSNN) and a latency-coding scheme. We trained it using a combination of spike-timing-dependent plasticity (STDP) for the lower layers and reward-modulated STDP (R-STDP) for the higher ones. In short, with R-STDP a correct (resp. incorrect) decision leads to STDP (resp. anti-STDP). This approach led to an accuracy of $97.2\%$ on MNIST, without requiring an external classifier. In addition, we demonstrated that R-STDP extracts features that are diagnostic for the task at hand, and discards the other ones, whereas STDP extracts any feature that repeats. Finally, our approach is biologically plausible, hardware friendly, and energy-efficient.

연구 동기 및 목표

컴퓨터 비전을 위한 딥 러닝에서 백프로파게이션의 생물학적으로 타당한 에너지 효율적인 대안을 개발하기 위해.
시간 코드를 사용하는 스파iking 신경망(SNN)을 활용하여 기존 딥 네트워크의 높은 데이터 및 에너지 요구량을 해결하기 위해.
외부 분류기나 백프로파게이션 없이도 딥 SNN의 엔드 투 엔드 학습을 가능하게 하기 위해.
R-STDP가 과제 관련 특징을 어떻게 추출하고 관련이 없는 특징을 기각하는지 조사하기 위해.
생물학적으로 영감을 받은 성숙성 규칙을 통해 훈련된 스파킹 신경망에서 하드웨어 호환성과 에너지 효율성을 입증하기 위해.

제안 방법

입력 데이터를 시간 패턴으로 표현하기 위해 지연 코드를 사용하는 깊이 컨volution스피킹 신경망(DCSNN)을 사용하였다.
하위층에서 표준 스파이크-타이밍 의존 성숙성(STDP)을 적용하여 입력 패턴으로부터 반복적인 시간적 특징을 학습하였다.
상위층에서 보상 조절 STDP(R-STDP)를 사용하였으며, 정확한 결정은 STDP를 강화하고 잘못된 결정은 반대 방향의 STDP를 유도하였다.
과제 수준 피드백에 기반하여 시냅스 가중치를 형상화하는 크레딧 할당 메커니즘으로서 R-STDP를 통합하여 백프로파게이션의 필요성을 제거하였다.
오직 局소적, 온라인, 생물학적으로 타당한 학습 규칙만을 사용하여 네트워크를 엔드 투 엔드로 훈련시켰다.
사건 기반 계산과 희소한 시간 코드를 활용하여 뉴모르픽 하드웨어와의 호환성을 확보하기 위해 아키텍처를 설계하였다.

실험 결과

연구 질문

RQ1STDP와 R-STDP로 훈련된 깊이 있는 스파이킹 신경망이 백프로파게이션 없이 MNIST와 같은 표준 비전 벤치마크에서 높은 정확도를 달성할 수 있는가?
RQ2과제 관련성 측면에서 R-STDP는 표준 STDP와 어떻게 다를까?
RQ3R-STDP는 얼마나 잘 비정보적 또는 중복적인 특징을 기각하면서 진단에 유용한 특징을 학습할 수 있는가?
RQ4제안된 훈련 방식은 생물학적으로 타당하며 뉴모르픽 하드웨어에 구현하기에 적합한가?
RQ5계층적 아키텍처에서 STDP와 R-STDP의 조합이 표준 딥 네트워크 수준의 성능을 달성하면서도 더 에너지 효율적인가?

주요 결과

제안된 DCSNN은 외부 분류기나 백프로파게이션 없이도 하위층에서만 STDP, 상위층에서만 R-STDP를 사용하여 MNIST 데이터셋에서 97.2%의 테스트 정확도를 달성하였다.
R-STDP는 과제 분류에 유용한 특징을 성공적으로 추출하여 비관련 또는 중복된 특징을 효과적으로 걸러내었다.
STDP는 과제 관련성과 무관하게 반복적인 시간 패턴을 학습하는 데 반해, R-STDP는 정확한 결정에 기여하는 시냅스만을 선택적으로 강화한다.
희소한 사고 기반 계산과 생물학적으로 타당한 학습 규칙의 사용 덕분에 네트워크는 뛰어난 에너지 효율성을 보였다.
아키텍처는 뉴모르픽 하드웨어와 호환되어 저전력 실시간 추론과 훈련을 가능하게 하였다.
결과적으로 R-STDP가 지도 학습 과제를 위한 깊이 있는 SNN에서 효과적이고 국소적이며 크레딧 할당 기능을 갖춘 학습 규칙이 될 수 있음을 검증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.