Skip to main content
QUICK REVIEW

[논문 리뷰] Logical Neural Networks

Ryan Riegel, Alexander Gray|arXiv (Cornell University)|2020. 06. 23.
Bayesian Modeling and Causal Inference참고 문헌 20인용 수 81
한 줄 요약

Logical Neural Networks (LNNs) are 뉴럴 학습과 기호 논리를 매핑하여 뉴런을 가중된 실수 로직의 요소에 대응시키고, 엔드-투-엔드 미분 가능하고 양방향이며 해석 가능한 추론을 개방 세계 경계와 함께 가능하게 한다.

ABSTRACT

We propose a novel framework seamlessly providing key properties of both neural nets (learning) and symbolic logic (knowledge and reasoning). Every neuron has a meaning as a component of a formula in a weighted real-valued logic, yielding a highly intepretable disentangled representation. Inference is omnidirectional rather than focused on predefined target variables, and corresponds to logical reasoning, including classical first-order logic theorem proving as a special case. The model is end-to-end differentiable, and learning minimizes a novel loss function capturing logical contradiction, yielding resilience to inconsistent knowledge. It also enables the open-world assumption by maintaining bounds on truth values which can have probabilistic semantics, yielding resilience to incomplete knowledge.

연구 동기 및 목표

  • 해석 가능한 지식 표현을 위해 뉴럴 학습과 기호 로직을 통합하는 신경-기호 프레임워크를 도입한다.
  • 뉴런과 논리식 원소 간의 1대1 대응을 구축하여 양방향의 검증 가능한 추론을 가능하게 한다.
  • 논리적 모순을 벌주하고 진리값 경계를 통해 개방 세계 가정을 지지하는 미분 가능 학습 목표를 개발한다.
  • 보장된 수렴성과 일차 로직 및 정리 증명에의 적용 가능성을 보여주는 추론 효율성을 입증한다.

제안 방법

  • 각 뉴런이 논리 원자나 연결기에 대응하고 출력이 [0,1]인 진리값 경계로 나타나는 그래프로 논리식을 표현한다.
  • 활성화 함수는 논리적 연결자(AND, OR, NOT, IMPLIES)에 맞도록 제약하고, grounding 튜플에 대한 min/max 집계를 통해 일차 원자량 양자에 대한 지원을 추가한다.
  • 가중치, 바이어스, 함수 f 등의 매개변수를 갖는 가중치 비선형 실수 로직을 도입하여 합동, 선택, 함의 등을 미분 가능 연산자로 구현한다.
  • 부분 공식을 따라 경계를 점진적으로 좁히는 상향–하향 추론 알고리즘을 적용하여 유한 단계 수렴이 일어나도록 한다.
  • 출력의 경계가 입력을 제약하도록 양방향 추론을 허용하여 LNN 프레임워크 내에서 modus ponens, modus tollens 와 같은 규칙을 가능하게 한다.
  • 모순을 벌주하고 고전 입력에서 고전적 동작을 촉진하는 손실 함수를 사용하여 역전파를 통해 신경 매개변수(가중치, 경계, 그리고 가능하면 원자 신뢰도)를 학습한다.

실험 결과

연구 질문

  • RQ1각 뉴런이 논리 식 구성 요소에 대응하는 구조로 구성되어 투명한 진리값 경계를 가능하게 할 수 있는가?
  • RQ2양방향 추론 및 경계 강화가 증명 가능한 추론과 유사한 수렴 가능한 추론을 미분 가능 모델 내에서 제공하는가?
  • RQ3개방 세계 가정을 진리값 경계로 표현하는 방식이 LNN에서 어떻게 가능하며 이진 참/거짓 라벨 대신 어떤 방식으로 작동하는가?
  • RQ4LNN은 일반적인 일차 로직을 지원하고 표준 정리 증명 벤치마크에서 기호 시스템과 비교했을 때 어떤 성능을 보이는가?
  • RQ5LNN은 불일치와 잡음이 있는 지식을 경계를 조정함으로써 정보를 버리지 않고 처리할 수 있는가?

주요 결과

  • LNN은 해석 가능한 표현을 가능하게 하는 1대1 뉴런–수식 대응을 갖춘 미분 가능, 엔드-투-엔드 프레임워크를 제공한다.
  • 추론은 양방향이며 유한 단계에서 수렴하여 신경 아키텍처 내에서 정리 증명과 유사한 추론이 가능하다.
  • 진리값은 경계로 표현되어 개방 세계 의미론과 확률적 해석을 지원하면서도 해석 가능성을 유지한다.
  • 실험에서 LNN이 특정 설정에서 LUBM 질의에 대해 전체 기억을 달성하고 일부 설정에서 정확한 기호 시스템과 함께 작업함을 보였으며, 불일치 공리를 위치시키고 가중치를 낮출 수 있다.
  • TPTP 및 관련 벤치마크에서 LNN은 여러 기호/잡음 규칙 기반의 방법과 비교하여 경쟁력 있거나 우수한 성능을 보였고 ATP 과제의 하위 집합에서 수 초 안에 문제를 증명했다.
  • LNN은 학습 중 모순에 대해 명시적으로 벌주할 수 있어 논리 구조를 존중하고 설명 가능성을 향상시키는 학습을 가능하게 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.