QUICK REVIEW

[논문 리뷰] RADAR: Reasoning as Discrimination with Aligned Representations for LLM-based Knowledge Graph Reasoning

Bo Xue, Yuan Jin|arXiv (Cornell University)|2026. 02. 25.

Advanced Graph Neural Networks인용 수 0

한 줄 요약

RADAR는 지식 그래프 추론을 생성적 패턴 매칭에서 정식적(판별) 관계 추론으로 재구성하고 정렬된 표현을 사용함으로써, out-of-distribution 일반화의 강건함과 강력한 LLM 베이스라인 대비 향상된 성능을 달성한다.

ABSTRACT

Knowledge graph reasoning (KGR) infers missing facts, with recent advances increasingly harnessing the semantic priors and reasoning abilities of Large Language Models (LLMs). However, prevailing generative paradigms are prone to memorizing surface-level co-occurrences rather than learning genuine relational semantics, limiting out-of-distribution generalization. To address this, we propose RADAR, which reformulates KGR from generative pattern matching to discriminative relational reasoning. We recast KGR as discriminative entity selection, where reinforcement learning enforces relative entity separability beyond token-likelihood imitation. Leveraging this separability, inference operates directly in representation space, ensuring consistency with the discriminative optimization and bypassing generation-induced hallucinations. Across four benchmarks, RADAR achieves 5-6% relative gains on link prediction and triple classification over strong LLM baselines, while increasing task-relevant mutual information in intermediate representations by 62.9%, indicating more robust and transferable relational reasoning.

연구 동기 및 목표

토큰 수준의 생성적 학습에서 동시 등장(공동출현) 지름길을 다루어 LLM과 함께 강건한 지식 그래프 추론을 촉진한다.
관계 타당성을 강조하기 위해 제약된 후보 공간 내에서 판별적 엔티티 선택으로 KGR를 재정의한다.
이산적 엔티티 분리를 반영한 감독 미세조정과 강화학습의 2단계 학습 체계를 개발한다.
생성으로 인한 환각을 피하고 판별적 학습 신호와의 일관성을 보장하기 위해 표현 공간에서 추론한다.
관계 추론의 강건성과 전달 가능성을 뒷받침하기 위해 정보 이득과 귀납적 일반화를 정량화한다.

제안 방법

KGR를 양성 엔티티와 음성(음수) 꼬리 엔티티를 결합한 후보 집합 내에서 판별적 엔티티 선택으로 재정의한다.
다양한 정답 계수와 음수 샘플 난이도를 갖는 계층적 작업 난이도를 도입한다.
연쇄적 사고 추론 흔적을 포함한 감독 미세조정으로 시작하고, 이어 Group Relative Policy Optimization으로 강화학습을 수행하는 2단계 학습 파이프라인을 사용한다.
중간 계층 표현을 추출하고 삼중항에 대한 이진 가능성 분류기를 훈련시켜 표현 공간에서의 추론을 구현한다.
후보를 제안하는 경량 KGE 모델과 이를 순위를 매기는 학습된 분류기를 이용해 링크 예측에 대해 retrieve-then-rerank 방식을 채택한다.
프로빙_classifier를 사용해 중간 표현에 인코딩된 작업 관련 정보를 측정하기 위한 작업 적응적 상호정보를 제안한다.

실험 결과

연구 질문

RQ1RADAR가 표준 KGR 벤치마크와 과제에서 강력하고 일관된 성능을 달성하는가?
RQ2RADAR의 핵심 설계 구성요소들(작업 형식화, 학습 목표, 추론 전략)이 성능과 일반화에 어떻게 기여하는가?
RQ3RADAR가 보지 못한 엔티티에 대한 강건한 귀납 일반화를 달성하고 도메인 관련 작업으로 관계 지식을 전이할 수 있는가?

주요 결과

RADAR는 네 가지 벤치마크에 걸쳐 링크 예측과 삼중 분류에서 강력한 LLM 베이스라인 대비 평균 5–6% 상대 향상을 달성한다.
제거 실험은 학습, 최적화, 추론을 판별적이고 표현 기반 추론과 일치시킴으로써 이득이 생김을 보여준다.
RADAR는 중간 표현에서 작업 관련 상호정보를 평균 62.9% 증가시켜 더 강건한 관계 추론을 나타낸다.
동일 베이스라인의 LLM-전용 설정에서 RADAR는 KG-LLAMA 및 FLAME 베이스라인에 대해 링크 예측 6.1%, 삼중 분류 5.7%의 평균 상대 이득을 제공한다.
RADAR는 링크 예측에서 LLaMA, Pythia, Qwen 등 여러 LLM에 대해 강건한 백본 독립적 개선을 보여준다.
RADAR는 귀납적 조건에서도 우수한 성능을 유지하며, 보지 못한 삼중항과 도메인 정렬 제로샷 작업에서 두드러진 이득을 얻는다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.