[論文レビュー] MAGMA: A Multi-Graph based Agentic Memory Architecture for AI Agents
MAGMA は AI エージェント用の関係を分離したマルチグラフ記憶(意味的・時間的・因果・エンティティ)を導入し、ポリシー導 guided グラフ探索によって証拠を取得する。以前の MAG システムより低遅延で長距離推論を改善する。
Memory-Augmented Generation (MAG) extends Large Language Models with external memory to support long-context reasoning, but existing approaches largely rely on semantic similarity over monolithic memory stores, entangling temporal, causal, and entity information. This design limits interpretability and alignment between query intent and retrieved evidence, leading to suboptimal reasoning accuracy. In this paper, we propose MAGMA, a multi-graph agentic memory architecture that represents each memory item across orthogonal semantic, temporal, causal, and entity graphs. MAGMA formulates retrieval as policy-guided traversal over these relational views, enabling query-adaptive selection and structured context construction. By decoupling memory representation from retrieval logic, MAGMA provides transparent reasoning paths and fine-grained control over retrieval. Experiments on LoCoMo and LongMemEval demonstrate that MAGMA consistently outperforms state-of-the-art agentic memory systems in long-horizon reasoning tasks.
研究の動機と目的
- 長距離推論のための MAG システムにおけるモノリシック記憶の制限に対処する。
- 意味的・時間的・因果・エンティティ関係を分離するマルチグラフ記憶基盤を提案する。
- 多ビュー間の検索を導く適応的で意図 aware な検索ポリシーを開発する。
- 記憶取り込みと推論を分離するデュアルストリーム(高速取り込み、非同期統合)ワークフローを導入する。
- LoCoMo および LongMemEval ベンチマークで最先端ベースラインを上回ることを実証する。
提案手法
- 記憶を4つの直交関係グラフ(意味・時間・因果・エンティティ)を用いた時変動型有向多重グラフとして表現する。
- 階層的で意図認識型のクエリルータを用いてクエリを分解し、複数ビュー間の検索を案内する。
- 構造的整合性と意味的類似性を統合してグラフ探索の動的遷移スコア S(nj|ni,q) を計算する。
- 取得したサブグラフを証拠性を持つナarrative プロンプトとして系列化し、幻覚を低減する。
- 高速シナプス取り込みと非同期構造統合を伴うデュアルストリーム記憶進化を実装する。
実験結果
リサーチクエスチョン
- RQ1マルチグラフ記憶基盤はモノリシックまたは意味論主導の MAG システムと比較して長距離推論を改善できるか。
- RQ2適応的で意図認識型の探索ポリシーは長-context タスクにおける検索効率と根拠付け品質を改善できるか。
- RQ3記憶取り込みと統合を分離して、応答性を保ちながら関係構造を深められるか。
- RQ4長-context ベンチマーク(LoCoMo、LongMemEval)における MAGMA の性能は最先端ベースラインと比較してどうか。
主な発見
| Method | Multi-Hop | Temporal | Open-Domain | Single-Hop | Adversarial | Overall |
|---|---|---|---|---|---|---|
| Full Context | 0.468 | 0.562 | 0.486 | 0.630 | 0.205 | 0.481 |
| A-MEM | 0.495 | 0.474 | 0.385 | 0.653 | 0.616 | 0.580 |
| MemoryOS | 0.552 | 0.422 | 0.504 | 0.674 | 0.428 | 0.553 |
| Nemori | 0.569 | 0.649 | 0.485 | 0.764 | 0.325 | 0.590 |
| MAGMA (ours) | 0.528 | 0.650 | 0.517 | 0.776 | 0.742 | 0.700 |
- MAGMA は LoCoMo で評価された方法の中で総合ジャッジスコアが最高(0.700)を達成し、Full Context、A-MEM、MemoryOS、Nemori を上回った。
- MAGMA は時間的推論と対抗的頑健性が強く、ジャッジスコアはそれぞれ 0.650 と 0.742。
- LongMemEval では MAGMA が最も高い平均正確度(61.2%)を達成し、Full Context よりもはるかに少ないトークン数で済む(0.7k–4.2k)。”
- MAGMA は適応的探索とデュアルストリーム設計により、最小のクエリ待機時間(1.47s)と競争力のあるトークンコスト(3.37k)を達成。
- アブレーションにより探索ポリシーが決定的であり、因果/時間的構造が大きな利得をもたらすことを示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。