[논문 리뷰] Brain-inspired Computational Intelligence via Predictive Coding
이 문서는 학습 및 추론을 위한 역전파의 뇌에서 영감을 받은 대안으로 예측 코딩(PC)을 조사하며 이론적 기초, 구현 및 ML 및 AI 시스템에서의 응용을 개략합니다.
Artificial intelligence (AI) is rapidly becoming one of the key technologies of this century. The majority of results in AI thus far have been achieved using deep neural networks trained with a learning algorithm called error backpropagation, always considered biologically implausible. To this end, recent works have studied learning algorithms for deep neural networks inspired by the neurosciences. One such theory, called predictive coding (PC), has shown promising properties that make it potentially valuable for the machine learning community: it can model information processing in different areas of the brain, can be used in control and robotics, has a solid mathematical foundation in variational inference, and performs its computations asynchronously. Inspired by such properties, works that propose novel PC-like algorithms are starting to be present in multiple sub-fields of machine learning and AI at large. Here, we survey such efforts by first providing a broad overview of the history of PC to provide common ground for the understanding of the recent developments, then by describing current efforts and results, and concluding with a large discussion of possible implications and ways forward.
연구 동기 및 목표
- 백프로파게이션(backpropagation)에 대한 강건하고 효율적인 대안으로 예측 코딩을 탐구하도록 AI 연구를 고무한다.
- 계층적 가우시안 생성 모델에 대한 변분 자유 에너지 최소화로서 PC의 통합 이론적 프레이밍을 제시한다.
- 세 가지 주요 PC 프레임워크(Rao–Ballard, Neural Generative Coding, Biased Competition with Divisive Modulation)와 그들의 학습/추론 역학을 검토한다.
- 지역성, 강건성, 임의의 토폴로지와 연속 상태 생성 모델에의 적합성 등의 PC의 장점을 강조한다.
제안 방법
- PC를 변분 자유 에너지(ELBO)를 최소화하여 계층적 생성 모델의 역으로 정의한다.
- 후처의 평균장 인수분해와 라플라스(가우시안) 근사를 사용해 국소 예측오류 기반 업데이트를 도출한다.
- PC 에너지 함수 E = 1/2 예측오차의 제곱합으로 표현하고 값 노드 및 시냅스 가중치의 국소 업데이트 규칙을 도출한다.
- PC 내의 지도학습과 비지도학습을 설명하고, 라벨을 처음과 마지막 층 상태를 클램핑하여 포함시키는 방법을 포함시킨다.
- 임의의 토폴로지를 처리하기 위한 PC 그래프를 통한 일반적인 PC 배선을 논의하며, 완전연결 및 희소 연결 구조를 포함한다.
- Neural Generative Coding(NGC) 및 Biased Competition with Divisive Modulation(BC-DIM)과 같은 변형과 그것들의 고전적 PC와의 차이점을 개요한다.
실험 결과
연구 질문
- RQ1계층적 생성 모델에 대한 역( inversion)/학습 체계로서 예측 코딩의 이론적 기반은 무엇인가?
- RQ2PC, NGC 및 BC-DIM이 전역 자유에너지 목표를 최소화하면서 어떻게 국소적이고 생물학적으로 타당한 업데이트를 구현하는가?
- RQ3임의의 토폴로지를 가진 확장 가능한 아키텍처 및 감독/비감독 학습 작업에 PC를 어떤 방식으로 적용할 수 있는가?
- RQ4계속적/온라인 또는 데이터가 적은 설정에서 표준 역전파에 비한 PC의 강건성과 학습상의 이점은 무엇인가?
주요 결과
- PC는 변분 자유 에너지를 최소화하여 수학적으로 근거가 있는 프레임워크를 제공하며, 국소 뉴런 수준의 예측오류 업데이트를 갖는다.
- 특정 조건에서 PC 업데이트는 역전파를 근사할 수 있으며, 지속적이고 데이터가 적은 학습에서 강건성 이점을 제공한다.
- NGC는 PC를 생물학적으로 더 타당한 배선 패턴과 신경 다이나믹스로 확장하고, 측방 경쟁 및 활성화 누출을 도입한다.
- PC 그래프는 고리(순환) 및 뇌 유사 구조를 포함한 임의의 구조를 가진 네트워크에서 학습을 가능하게 한다.
- 지도 학습 PC 접근 방식은 특정 작업에서 에너지 기반 학습 패러다임으로 심층 네트워크의 성능과 일치하거나 근접할 수 있다.
- 일부 설정에서 PC는 기존의 역전파 학습 네트워크보다 강건성과 보정된 학습을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.