Skip to main content
QUICK REVIEW

[論文レビュー] ValueFlow: Measuring the Propagation of Value Perturbations in Multi-Agent LLM Systems

Jinnuo Liu, Chuke Liu|arXiv (Cornell University)|Feb 9, 2026
Topic Modeling被引用数 0
ひとこと要約

ValueFlowフレームワークは、マルチエージェントLLMシステムにおける価値のドリフトの伝播を定量化する摂動ベースのフレームワークで、影響をエージェントレベルの感受性とシステムレベルのトポロジー効果に分解します。56値のデータセットを提供し、トポロジーが伝播を強く形作ることを示します。

ABSTRACT

Multi-agent large language model (LLM) systems increasingly consist of agents that observe and respond to one another's outputs. While value alignment is typically evaluated for isolated models, how value perturbations propagate through agent interactions remains poorly understood. We present ValueFlow, a perturbation-based evaluation framework for measuring and analyzing value drift in multi-agent systems. ValueFlow introduces a 56-value evaluation dataset derived from the Schwartz Value Survey and quantifies agents' value orientations during interaction using an LLM-as-a-judge protocol. Building on this measurement layer, ValueFlow decomposes value drift into agent-level response behavior and system-level structural effects, operationalized by two metrics: beta-susceptibility, which measures an agent's sensitivity to perturbed peer signals, and system susceptibility (SS), which captures how node-level perturbations affect final system outputs. Experiments across multiple model backbones, prompt personas, value dimensions, and network structures show that susceptibility varies widely across values and is strongly shaped by structural topology.

研究の動機と目的

  • 相互作用するLLMエージェントを通じて価値の摂動が伝播する動機づけと定量化。
  • エージェント応答とネットワーク構造の影響を分離する測定フレームワークの開発。
  • 対話環境のためにSchwartz Value Surveyから導出した56値評価データセットの作成。
  • より安全でトポロジー対応のマルチエージェントシステムを設計するための実用的な洞察の提供。

提案手法

  • LLM呼び出しの有向非巡回グラフ(DAG)としてマルチエージェントの相互作用をモデル化。
  • 56値のSVS由来データセットを用いてエージェントの価値指向性を定量化し、LLMをジャッジとしてYes–No質問を採点。
  • COPROアルゴリズムによる極端な賛成/拒否を誘導するように最適化されたプロンプトレベルのプロンプトを介して、制御された価値摂動を導入。
  • 定義された式を用いて、価値のドリフトをエージェントレベルの感受性(beta)とシステムレベルの感受性(SS)に分解。
  • バックボーンモデル、オープンネス・ペルソナ、価値次元、入力分散、トポロジーを横断して評価。
  • マルチエージェントLLMシステムにおける価値の頑健性を評価する拡張可能なツールチェーンと分析パイプラインを提供。

実験結果

リサーチクエスチョン

  • RQ1トポロジーと摂動発生場所を変えた場合、マルチエージェントLLM相互作用において価値の摂動はどのように伝播するか?
  • RQ2エージェントレベルの応答性(beta感受性)とネットワーク構造が、システムレベルの価値伝播(SS)をどのように共同で形作るか?
  • RQ3 promptingスタイル、ベースラインモデル、入力分散が、価値次元ごとの価値感受性にどのような影響を与えるか?
  • RQ4どのようなトポロジーデザイン原理が、マルチエージェントシステムにおける価値のドリフトを緩和または増幅させるか?

主な発見

Backbone ModelMean β
Gemma3-27B0.6050
Qwen3-8B0.5620
GPT-3.5-Turbo0.4515
GPT-4o0.4078
LLama-3.3-70B0.3245
  • Value感受性は56の価値次元間で大きく異なる。規範値は感受性が低い一方、文脈依存の値は感受性が高い。
  • オープネス・プロンプトは一般にbeta感受性を高める傾向だが、効果は値依存で一様ではない。
  • バックボーンモデルはbeta感受性に体系的に差がある。Gemma3-27BとQwen3-8BはGPT-4oとLLama-3.3-70Bより平均が高い(56値の平均beta:Gemma3-27B 0.6050; Qwen3-8B 0.5620; GPT-3.5-Turbo 0.4515; GPT-4o 0.4078; LLama-3.3-70B 0.3245)。
  • 入力分散が大きいほど、値ごとのエージェントレベル感受性が高まる。
  • エージェントレベルの感受性はシステムレベルの伝播を強く予測する:betaが高いほど、層を超えたシステム偏差がより持続する。
  • トポロジーは伝播を形作る:出力到達性と中心性が高いほどSSが増加する一方、摂動ノードの高い入次数は伝播を減衰させる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。