QUICK REVIEW

[논문 리뷰] SentGraph: Hierarchical Sentence Graph for Multi-hop Retrieval-Augmented Question Answering

Junli Liang, Pengfei Zhou|arXiv (Cornell University)|2026. 01. 06.

Topic Modeling인용 수 0

한 줄 요약

SentGraph은 정교화된 수사 구조 이론(Rhetorical Structure Theory)을 사용한 문장 수준의 계층 그래프를 오프라인으로 구성하여 그래프-가이드형 다중 홉 검색 및 답변 생성을 가능하게 하고, 청크 기반 및 기타 그래프 방법을 능가한다.

ABSTRACT

Traditional Retrieval-Augmented Generation (RAG) effectively supports single-hop question answering with large language models but faces significant limitations in multi-hop question answering tasks, which require combining evidence from multiple documents. Existing chunk-based retrieval often provides irrelevant and logically incoherent context, leading to incomplete evidence chains and incorrect reasoning during answer generation. To address these challenges, we propose SentGraph, a sentence-level graph-based RAG framework that explicitly models fine-grained logical relationships between sentences for multi-hop question answering. Specifically, we construct a hierarchical sentence graph offline by first adapting Rhetorical Structure Theory to distinguish nucleus and satellite sentences, and then organizing them into topic-level subgraphs with cross-document entity bridges. During online retrieval, SentGraph performs graph-guided evidence selection and path expansion to retrieve fine-grained sentence-level evidence. Extensive experiments on four multi-hop question answering benchmarks demonstrate the effectiveness of SentGraph, validating the importance of explicitly modeling sentence-level logical dependencies for multi-hop reasoning.

연구 동기 및 목표

청크 수준 방법을 넘어 더 나은 다중 홉 QA 검색의 필요성을 제기한다.
정밀한 문장 간 관계를 모델링하기 위한 계층적 문장 그래프 프레임워크를 제안한다.
효율적인 온라인 검색 및 추론을 가능하게 하기 위해 그래프 구성을 오프라인으로 분리하여.
여러 LLM에서 네 가지 다중 홉 QA 벤치마크에서 개선된 성능을 보여준다.
토큰 효율성을 평가하고 구성요소의 기여를 검증하기 위한 아블레이션 연구를 제공한다.

제안 방법

핵심-위성(nucleus-satellite) 및 핵심-핵심(nucleus-nucleus) 관계를 정의하기 위해 각색된 수사 구조 이론(Rhetorical Structure Theory)을 사용한 계층적 문장 논리 그래프의 오프라인 구성.
세 계층 그래프: 토픽 노드(Vt), 핵심 문장 노드(Vc), 보조 문장 노드(Vs); 간선은 주제 간 관계, 주제-핵심 관계, 핵심-핵심 관계 및 핵심-보조 관계를 포착한다.
엔터티-개념 연결을 통한 문서 간 다리를 통해 주제를 문서 간으로 연결한다.
거친-정교한 앵커 선택(coarse-to-fine) 방식, 적응적 증거 정제, 그래프 안내 경로 확장을 통해 간결하고 증거가 풍부한 맥락을 구성하는 온라인 검색.
수집된 문장 수준의 증거를 사용해 최종 답을 생성하는 생성 단계.
앵커 선택, 증거 정제 및 경로 확장에 대한 영향을 정량화하기 위한 아블레이션 분석.

실험 결과

연구 질문

RQ1명시적 논리 관계를 갖춘 문장 수준 그래프가 청크 수준 그래프보다 다중 홉 증거 검색을 개선할 수 있는가?
RQ2오프라인 계층적 문장 그래프 구성이 온라인 계산을 줄이면서 QA 성능을 유지하거나 향상시키는가?
RQ3정밀한 증거 선택과 구조화된 추론 경로가 다중 홉 QA 정확도와 효율성에 미치는 영향은 무엇인가?
RQ4다른 기본 LLM들이 검색 설정(BM25 대 BGE)에서 SentGraph의 이득에 어떤 영향을 미치는가?

주요 결과

SentGraph는 희소(BM25)와 밀집(BGE) 검색 설정 모두에서 네 가지 다중 홉 QA 벤치마크에서 최첨단 성능을 달성한다.
그래프 기반 추론을 통한 문장 수준 검색은 조각 수준 검색 및 거친 청크에서 작동하는 다른 그래프 방법들보다 현저히 우수하다.
BM25 하에서 SentGraph의 문장 수준 검색은 HotpotQA에서 48.80 EM 및 61.98 F1, 2Wiki에서 44.40 EM 및 52.53 F1, MuSiQue에서 25.00 EM 및 35.09 F1을 달성하고, 68.80% MultiHop 정확도를 달성한다.
BGE에서 SentGraph의 문장 수준 검색은 HotpotQA에서 57.60 EM 및 68.74 F1, 2Wiki에서 54.20 EM 및 63.05 F1, MuSiQue에서 38.80 EM 및 52.01 F1로, 73.00% MultiHop 정확도를 기록한다.
아블레이션 분석은 앵커 선택, 증거 정제, 안내 경로 확장이 각각 이득에 상당히 기여하며, 약 20개의 앵커를 넘으면 수익이 감소한다.
SentGraph는 KGP와 같은 그래프 기반 기초 대비 입력 및 출력 토큰을 감소시켜 더 정밀한 증거 선택과 구조화된 추론으로 더 나은 효율성을 나타낸다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.