Skip to main content
QUICK REVIEW

[논문 리뷰] HyperRAG: Reasoning N-ary Facts over Hypergraphs for Retrieval Augmented Generation

Wen-Sheng Lien, Yu-Kai Chan|arXiv (Cornell University)|2026. 02. 16.
Advanced Graph Neural Networks인용 수 0
한 줄 요약

HyperRAG는 n-ary 하이퍼그래프에서의 추론을 검색 보강 생성에 제안하며, 두 가지 검색 모드(HyperRetriever와 HyperMemory)를 통해 의미 fragmentation 감소 및 path explosion 완화, 그리고 다중 홉 QA 성능 향상을 달성한다.

ABSTRACT

Graph-based retrieval-augmented generation (RAG) methods, typically built on knowledge graphs (KGs) with binary relational facts, have shown promise in multi-hop open-domain QA. However, their rigid retrieval schemes and dense similarity search often introduce irrelevant context, increase computational overhead, and limit relational expressiveness. In contrast, n-ary hypergraphs encode higher-order relational facts that capture richer inter-entity dependencies and enable shallower, more efficient reasoning paths. To address this limitation, we propose HyperRAG, a RAG framework tailored for n-ary hypergraphs with two complementary retrieval variants: (i) HyperRetriever learns structural-semantic reasoning over n-ary facts to construct query-conditioned relational chains. It enables accurate factual tracking, adaptive high-order traversal, and interpretable multi-hop reasoning under context constraints. (ii) HyperMemory leverages the LLM's parametric memory to guide beam search, dynamically scoring n-ary facts and entities for query-aware path expansion. Extensive evaluations on WikiTopics (11 closed-domain datasets) and three open-domain QA benchmarks (HotpotQA, MuSiQue, and 2WikiMultiHopQA) validate HyperRAG's effectiveness. HyperRetriever achieves the highest answer accuracy overall, with average gains of 2.95% in MRR and 1.23% in Hits@10 over the strongest baseline. Qualitative analysis further shows that HyperRetriever bridges reasoning gaps through adaptive and interpretable n-ary chain construction, benefiting both open and closed-domain QA.

연구 동기 및 목표

  • 이진 그래프가 표현하기 어려운 복잡하고 다중 엔티티 사실에 대해 Retrieval-Augmented Generation (RAG)을 동기화한다.
  • 관계적 무결성을 보존하고 추론 단계를 줄이기 위해 n-ary 하이퍼그래프에서 작동하도록 HyperRAG를 제안한다.
  • 적응형 검색을 위해 두 가지 검색 패러다임—HyperRetriever(구조-의미 체인 학습)와 HyperMemory(LLM-guided memory)—를 개발한다.
  • 정확도와 효율성 이점을 입증하기 위해 HyperRAG를 오픈 도메인 QA 벤치마크와 폐쇄 도메인 WikiTopics CLQA에서 평가한다.

제안 방법

  • 의미적 분할 및 경로 폭발을 피하기 위해 n-ary 관계 하이퍼그래프를 RAG의 지식 기질로 도입한다.
  • HyperRetriever는 주제 엔티티와 하이퍼엣지로부터의 구조적 및 의미 신호를 융합하기 위해 MLP를 사용하여 쿼리 조건부 관계 체인을 구축한다.
  • HyperRetriever는 n-ary 사실에서 의사 이진 삼중 항을 도출하고, 구조적 근접성을 위한 방향성 거리 인코딩(DDE)을 적용하며, 대조적(contrastive) MLP를 사용해 삼중 항의 가능성을 점수화한다.
  • 임계값 설정 및 밀도 인식 정책을 통한 적응형 검색이 검색 깊이와 폭을 제어한다.
  • HyperMemory는 LLM 기반 메모리를 활용하여 하이퍼그래프에서 빔 탐색을 안내하고 하이퍼엣지와 꼬리 엔티티를 점수화하여 후보 경로를 형성한다.
  • 예산 인식 컨텍스트화 생성기가 검색된 증거와 쿼리 맥락을 LLM에 제공하여 최종 답을 생성하도록 포맷한다.
Figure 1 . Structural Comparison of (a) Knowledge Graphs and (b) Hypergraphs. For a given question $q$ , (a) requires 3-hop reasoning over binary facts, while (b) enables single-hop inference via an $n$ -ary relational fact, yielding a more compact and expressive multi-entity representation.
Figure 1 . Structural Comparison of (a) Knowledge Graphs and (b) Hypergraphs. For a given question $q$ , (a) requires 3-hop reasoning over binary facts, while (b) enables single-hop inference via an $n$ -ary relational fact, yielding a more compact and expressive multi-entity representation.

실험 결과

연구 질문

  • RQ1n-ary 하이퍼그래프 표현이 이진 KG와 비교해 검색 충실도와 추론 단계를 개선할 수 있는가?
  • RQ2적응형 HyperRetriever와 메모리-guided HyperMemory가 오픈 도메인 및 클로즈드 도메인 QA 전반에서 더 높은 정확도와 효율성을 가능하게 하는가?
  • RQ3하이퍼에지에 대한 고차원 추론이 RAG의 해석 가능성과 증거 추적에 어떤 영향을 미치는가?
  • RQ4QA 성능 및 일반화 측면에서 HyperRetriever와 HyperMemory의 비교 영향은 무엇인가?
  • RQ5미지의 주제 및 밀도 높은/낮은 하이퍼그래프에 대해 이 접근법이 얼마나 잘 일반화되는가?

주요 결과

  • HyperRAG는 WikiTopics CLQA에서 strongest baseline 대비 평균 MRR에서 2.95%의 상승, Hits@10에서 1.23%의 상승으로 더 높은 정답 정확도를 달성한다.
  • HyperRetriever는 학습 가능한 타당성 점수화와 적응형 확장으로 오픈 도메인 QA 벤치마크(HotpotQA, MuSiQue 등)에서 HyperMemory보다 우수하다.
  • 밀도 높은 교차 도메인 설정에서 HyperRetriever는 주목할 만한 개선을 달성한다(예: 2WikiMultiHopQA에서 상대적 F1 개선 11.89%).
  • 11개 주제에 걸쳐 HyperRetriever는 평균 MRR 상승 2.95% 및 Hits@10 상승 1.23%를 나타내며, 두 번째로 좋은 벤치마크 대비 통계적으로 유의한 결과(p << 0.001)이다.
  • HyperMemory는 일반적으로 HyperRetriever에 비해 성능이 떨어지며, n-ary 검색에서 LLM 매개 메모리보다 명시적 구조 학습의 가치를 강조한다.
Figure 2 . The overall framework of HyperRAG.
Figure 2 . The overall framework of HyperRAG.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.