Skip to main content
QUICK REVIEW

[논문 리뷰] SuperLocalMemory V3: Information-Geometric Foundations for Zero-LLM Enterprise Agent Memory

Varun Pratap Bhardwaj|arXiv (Cornell University)|2026. 03. 15.
Topological and Geometric Data Analysis인용 수 0
한 줄 요약

SLM-V3는 코사인 유사도를 Fisher-information-weighted 검색으로 대체하고, sheaf-코호몰로지 일관성 계층을 추가하며, 기억 수명 주기에 대해 리만 Langevin 다이나믹스를 사용하여 제로-LLM 검색을 달성하고 LoCoMo에서 강력한 실험적 이득을 얻었다.

ABSTRACT

Persistent memory is a central capability for AI agents, yet the mathematical foundations of memory retrieval, lifecycle management, and consistency remain unexplored. Current systems employ cosine similarity for retrieval, heuristic decay for salience, and provide no formal contradiction detection. We establish information-geometric foundations through three contributions. First, a retrieval metric derived from the Fisher information structure of diagonal Gaussian families, satisfying Riemannian metric axioms, invariant under sufficient statistics, and computable in O(d) time. Second, memory lifecycle formulated as Riemannian Langevin dynamics with proven existence and uniqueness of the stationary distribution via the Fokker-Planck equation, replacing hand-tuned decay with principled convergence guarantees. Third, a cellular sheaf model where non-trivial first cohomology classes correspond precisely to irreconcilable contradictions across memory contexts. On the LoCoMo benchmark, the mathematical layers yield +12.7 percentage points over engineering baselines across six conversations, reaching +19.9 pp on the most challenging dialogues. A four-channel retrieval architecture achieves 75% accuracy without cloud dependency. Cloud-augmented results reach 87.7%. A zero-LLM configuration satisfies EU AI Act data sovereignty requirements by architectural design. To our knowledge, this is the first work establishing information-geometric, sheaf-theoretic, and stochastic-dynamical foundations for AI agent memory systems.

연구 동기 및 목표

  • 검색, 수명 주기, 그리고 일관성에서 지속 가능한 에이전트 기억의 수학적 기초를 규명한다.
  • 휴리스틱 기반 기억 검색을 원리적이고 정보 기하학적 메트릭으로 대체한다.
  • 메모리 맥락 간 모순을 형식적으로 감지하는 기제를 제공한다.
  • 데이터 주권 요건을 충족하는 확장 가능한 제로-LLM 기억 작동을 시연한다.

제안 방법

  • 피셔–라오 시맨틱 검색, BM25, 엔티티 그래프, 시간 채널을 통합한 네 채널 검색 아키텍처를 도입한다.
  • 차원별 불확실성을 갖는 기억 임베딩에 대해 분산 가중 피셔 정보 메트릭을 개발한다.
  • 메모리 저장소를 셀룰러 시프로 모델링하고, 비가역적 모순을 검출하기 위해 1차 코호몰로지를 사용한다.
  • 메모리 수명 주기를 리만 Langevin 다이나믹스로 형식화하고, 정상분포의 존재성과 고유성에 대한 증명을 제시한다.
  • 가중된 역순위 융합과 신경 재랭킹을 통한 최적화를 위한 네 채널 융합을 제공한다.
  • LoCoMo에서 클라우드 제외 검색으로 제로-LLM 구성을 평가하고 기준값 대비 개선을 보고한다.
Figure 1 : The SLM-V3 architecture. Left: Ingestion pipeline processes content through entropy gating, fact extraction, entity resolution, graph construction, and sheaf consistency checking ( $H^{1}\neq 0$ detects contradictions). Center: Four-channel retrieval with Fisher-information-weighted scori
Figure 1 : The SLM-V3 architecture. Left: Ingestion pipeline processes content through entropy gating, fact extraction, entity resolution, graph construction, and sheaf consistency checking ( $H^{1}\neq 0$ detects contradictions). Center: Four-channel retrieval with Fisher-information-weighted scori

실험 결과

연구 질문

  • RQ1지속 가능한 AI 기억에서 검색, 수명 주기 관리, 일관성에 적합한 수학적 구조는 무엇인가?
  • RQ2고차원 임베딩에서 피셔 정보 기반 검색이 코사인 유사도보다 향상될 수 있는가?
  • RQ3다중 컨텍스트 저장소에서 기억 모순을 형식적으로 어떻게 탐지하고 진단할 수 있는가?
  • RQ4정보 기하학적 기초를 갖춘 제로-LLM 배치가 클라우드 접근 없이도 경쟁력 있는 검색을 달성하는가?

주요 결과

  • 세 가지 수학적 계층을 통한 LoCoMo 대화 6건(n=832)에서 엔지니어링 기준선 대비 평균 +12.7 포인트의 이득.
  • 가장 도전적인 대화에서 최대 +19.9 포인트의 이득.
  • 네 채널 검색이 클라우드 의존 없이 약 75%의 검색 품질을 달성.
  • 제로-LLM 구성은 75%의 검색 품질에 도달하여 데이터 주권 실현 가능성을 시연.
  • 제거 실험은 크로스 인코더 재랭킹이 성능 향상의 가장 큰 기여자임을 보여준다.
  • 크로스-홉 추론이 수학적 계층에서 +12 pp 이득을 보여준다.
Figure 2 : Competitive landscape of agent memory systems (March 2026) evaluated on LoCoMo. All systems above SLM-V3 require cloud LLM dependency. SLM-V3 Mode A Retrieval (74.8%) is the highest reported score achievable without cloud dependency during retrieval. Stars ( $\star$ ) denote zero-LLM conf
Figure 2 : Competitive landscape of agent memory systems (March 2026) evaluated on LoCoMo. All systems above SLM-V3 require cloud LLM dependency. SLM-V3 Mode A Retrieval (74.8%) is the highest reported score achievable without cloud dependency during retrieval. Stars ( $\star$ ) denote zero-LLM conf

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.