QUICK REVIEW

[논문 리뷰] Structured Episodic Event Memory

Zhengxuan Lu, Dongfang Li|arXiv (Cornell University)|2026. 01. 10.

Topic Modeling인용 수 0

한 줄 요약

SEEM은 그래프 메모리 계층과 동적 에피소드 메모리 계층을 결합한 계층적 메모리 시스템을 도입해 LLM 기반 에이전트의 장기 추론을 향상시키고, LoCoMo와 LongMemEval에서 기준 모델보다 우수하다.

ABSTRACT

Current approaches to memory in Large Language Models (LLMs) predominantly rely on static Retrieval-Augmented Generation (RAG), which often results in scattered retrieval and fails to capture the structural dependencies required for complex reasoning. For autonomous agents, these passive and flat architectures lack the cognitive organization necessary to model the dynamic and associative nature of long-term interaction. To address this, we propose Structured Episodic Event Memory (SEEM), a hierarchical framework that synergizes a graph memory layer for relational facts with a dynamic episodic memory layer for narrative progression. Grounded in cognitive frame theory, SEEM transforms interaction streams into structured Episodic Event Frames (EEFs) anchored by precise provenance pointers. Furthermore, we introduce an agentic associative fusion and Reverse Provenance Expansion (RPE) mechanism to reconstruct coherent narrative contexts from fragmented evidence. Experimental results on the LoCoMo and LongMemEval benchmarks demonstrate that SEEM significantly outperforms baselines, enabling agents to maintain superior narrative coherence and logical consistency.

연구 동기 및 목표

LLM 기반 에이전트의 산재된 검색과 약한 장기 기억을 해결한다.
정적 관계 사실을 위한 Graph Memory Layer(GML)와 동적 서사 진행을 위한 Episodic Memory Layer(EML)를 결합한 이중층 메모리 시스템을 개발한다.
메모리 유닛을 포인터를 통해 정확한 기원으로 접지하고, 복잡한 추론을 위한 맥락의 일관된 재구성을 가능하게 한다.
LoCoMo와 LongMemEval에서 SEEM을 평가하고 메모리 보강 및 밀집 검색 기반의 벤치마크와 비교한다.

제안 방법

상호작용 스트림을 이중층 메모리로 변환한다: Episodic Event Frames(EEFs)가 있는 EML과 관계 사분원(relational quadruples)가 있는 GML.
LLM 기반 추출기를 사용해 구절에서 EEF를 추출하고 기원 포인터로 고정한다; 연관 프레임들을 연합 응집으로 융합한다.
관계 사분원을 접지하고 유사한 노드를 합쳐 구절에서 관계 그래프를 구성한다.
Relational Propagation과 Reverse Provenance Expansion을 사용한 하이브리드 검색으로 기원 링크를 통해 검색된 맥락을 확장한다.
확장된 구절, EEF 및 관계 사실을 직렬화하여 LLM의 조건부 생성을 위한 최종 맥락을 합성한다.
BLEU-1, F1, J(LLM judge), LongMemEval의 정확도 등 렉시컬 및 시맨틱 지표로 평가하고, 제거 실험과 사례 연구를 수행한다.

실험 결과

연구 질문

RQ1계층적 메모리 아키텍처가 평면적이거나 순수하게 밀집 검색에 의한 접근보다 장기 상호작용에서 일관성과 사실적 일관성을 개선할 수 있는가?
RQ2구조화된 에피소드 이벤트 프레임과 연합 융합이 기존 메모리 시스템보다 이야기 진행과 시간적 추론을 더 잘 보존하는가?
RQ3역방향 기원 확장이 맥락의 완전성과 추론 품질에 어떤 영향을 미치는가?
RQ4SEEM 구성 요소 각각(EEF, RPE, GML 프로비저닝, 관계 전파)이 전반적 성능에 어떤 기여를 하는가?

주요 결과

BLEU-1	F1	J	정확도
KaLM-Embedding-V2.5	44.4	47.9	64.6	55.6
NV-Embed-v2	53.0	57.9	74.7	58.4
Mem0	34.2	43.3	54.1	56.7
A-MEM	45.7	44.6	61.9	55.2
HippoRAG 2	53.8	58.3	76.2	60.6
SEEM (Ours)	56.1	61.1	78.0	65.0

SEEM은 LoCoMo와 LongMemEval에서 렉시컬 및 시맨틱 지표 모두에서 최고 점수를 달성한다.
LoCoMo에서 SEEM은 BLEU-1 56.1, F1 61.1, J 78.0, Acc. 65.0를 달성하여 HippoRAG 2보다 각각 F1에서 2.8%, J에서 1.5% 우수하다.
LongMemEval에서 SEEM은 65.0% 정확도를 달성하여 HippoRAG 2 대비 4.4pp 향상이다.
SEEM은 시맨틱 평가(J) 및 장기 정확도에서 Dense 검색 벤치마크(NV-Embed-v2 등)를 크게 능가하여 강한 서사적 근거와 일관성을 시사한다.
절제 실험은 핵심 구성 요소(EEF, RPE, Relational Propagation, Fact Provisioning)가 성능에 기여함을 보여주며, 어느 것을 제거해도 지표가 감소한다.
시간적 및 적대적 추론은 에피소드 메모리 레이어와 기원 접지로부터 특히 큰 이점을 얻는다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.