QUICK REVIEW

[논문 리뷰] Toward an Integration of Deep Learning and Neuroscience

Adam Marblestone, Greg Wayne|arXiv (Cornell University)|2016. 06. 01.

Neural dynamics and brain function참고 문헌 571인용 수 683

한 줄 요약

이 논문은 뇌가 다양한 발달 조절 비용 함수가 전문화된 사전 구조화된 신경 구조에서 최적화되는 이질적이고 다중 구성 요소 시스템으로 기능한다고 제안한다—딥 러닝 원리와 신경과학을 통합하는 통합 프레임워크를 제공한다. 학습 효율성은 균일한 최적화에서 비롯되지 않으며, 상호작용하는 비용 함수와 주의, 기억, 라우팅 메커니즘과 같은 구조화된 시스템에서 비롯된다고 주장한다.

ABSTRACT

Neuroscience has focused on the detailed implementation of computation, studying neural codes, dynamics and circuits. In machine learning, however, artificial neural networks tend to eschew precisely designed codes, dynamics or circuits in favor of brute force optimization of a cost function, often using simple and relatively uniform initial architectures. Two recent developments have emerged within machine learning that create an opportunity to connect these seemingly divergent perspectives. First, structured architectures are used, including dedicated systems for attention, recursion and various forms of short- and long-term memory storage. Second, cost functions and training procedures have become more complex and are varied across layers and over time. Here we think about the brain in terms of these ideas. We hypothesize that (1) the brain optimizes cost functions, (2) the cost functions are diverse and differ across brain locations and over development, and (3) optimization operates within a pre-structured architecture matched to the computational problems posed by behavior. In support of these hypotheses, we argue that a range of implementations of credit assignment through multiple layers of neurons are compatible with our current knowledge of neural circuitry, and that the brain's specialized systems can be interpreted as enabling efficient optimization for specific problem classes. Such a heterogeneously optimized system, enabled by a series of interacting cost functions, serves to make learning data-efficient and precisely targeted to the needs of the organism. We suggest directions by which neuroscience could seek to refine and test these hypotheses.

연구 동기 및 목표

딥 러닝의 최적화 중심 접근 방식과 신경과학의 신경 구현에 중점을 둔 접근 방식을 통합하는 프레임워크를 제안하여 조율한다.
뇌가 단일 글로벌 목표가 아니라 다수의 이질적 비용 함수를 최적화하는가를 조사한다.
특화된 신경 구조(예: 기억, 주의, 라우팅)가 생물학적 시스템에서 효율적이고 데이터 효율적인 학습을 어떻게 가능하게 하는지 탐구한다.
비용 함수가 발달 과정에서 어떻게 변화하고 뇌 영역 간에 어떻게 다를 수 있는지 살펴본다. 이는 다양한 인지 기능을 지원하기 위함이다.
뇌 기능에 대한 검증 가능한 가설을 제안함으로써 신경과학과 기계 학습 간의 교차 분야 대화를 촉진한다.

제안 방법

뇌가 생물학적으로 타당한 기울기 근사 메커니즘을 사용하여 내부 비용 함수를 최적화한다고 제안한다—딥 러닝과 유사하게.
비용 함수가 뇌 영역이나 발달 단계에 따라 균일하지 않으며, 대신 다양하고 맥락에 따라 특화된다는 아이디어를 도입한다.
콘텐츠 기반 주소 기억, 워킹 메모리 버퍼, 주의 메커니즘과 같은 특화된 신경 시스템을 효율적 최적화를 가능하게 하는 구조적 뼈대로 식별한다.
전역 최적화를 근사하는 局부 학습 규칙을 통해 비용 함수가 구현될 수 있으며, 생물학적으로 타당한 역전파 변형이 이를 뒷받침할 수 있다고 제안한다.
메타 수준의 학습 메커니즘이 다양한 비용 함수와 시스템 간의 활성화 및 상호작용을 조절할 수 있다고 제안한다.
딥 러닝 구성 요소(예: 캡슐, 주의, 메모리 네트워크)와 알려진 뇌 구조 간의 유사성을 그려내며, 검증 가능한 신경 구현을 제안한다.

실험 결과

연구 질문

RQ1다른 뇌 영역이 서로 다른 비용 함수를 최적화하는가? 그리고 이러한 함수들이 발달 과정에서 어떻게 변화하는가?
RQ2특화된 신경 구조(예: 기억, 주의)가 뇌에서 다양한 비용 함수의 효율적 최적화를 어떻게 가능하게 하는가?
RQ3다층 신경 시스템에서 기울기 강하를 근사하는 데 생물학적 메커니즘은 무엇이며, 인공 역전파와 어떻게 다를 수 있는가?
RQ4비용 함수가 뇌에서 명시적으로 계산되는 정도는 어느 정도이며, 국부적 학습 규칙에 암묵적으로 통합되는가?
RQ5뇌가 특정 작업에 대해 어떤 비용 함수나 시스템을 활성화할지 선택하거나 조절하기 위해 메타학습을 어떻게 활용할 수 있는가?

주요 결과

뇌는 단일 글로벌 목표가 아니라, 뇌 영역과 발달 시간에 따라 다양하고 이질적인 비용 함수를 최적화할 가능성이 높다.
콘텐츠 기반 주소 기억, 워킹 메모리 버퍼, 주의 메커니즘과 같은 특화된 신경 구조는 계산과 정보 흐름을 구조화함으로써 효율적 최적화를 가능하게 한다.
피드백 정렬 또는 국부적 규칙을 사용하는 오차 역전파와 같은 생물학적으로 타당한 기울기 강하 근사가 깊은 신경 회로에서 학습의 기초가 될 수 있다.
뇌의 비용 함수는 진화적 압력과 발달 과정에 의해 형성되며, 행동적으로 관련된 표현으로 비지도 및 지도 학습을 이끌 수 있다.
다양한 비용 함수와 특화된 시스템 간의 상호작용은 데이터 효율적이고 목표 지향적인 학습을 가능하게 하며, 딥 러닝 기법인 정규화 및 적대적 훈련과 유사하다.
이 프레임워크는 지능이 단일 최적화 과정에서 비롯되지 않으며, 미니스키의 '마음의 사회'에서 영감을 얻어 상호작용하는 비용 함수와 학습 가능한 모듈의 '사회'에서 유래된다는 점을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.