Skip to main content
QUICK REVIEW

[論文レビュー] Position: AI Agents Are Not (Yet) a Panacea for Social Simulation

Li, Yiming, Tao, Dacheng|arXiv (Cornell University)|Feb 19, 2026
Language and cultural evolution被引用数 0
ひとこと要約

この論文は、LLMベースのエージェントが信頼できる社会シミュレーションにはまだ不十分であり、妥当な振る舞いと機械的・政策関連推論との不一致を解決するための環境関与型のエージェントベースフレームワークを導入します。

ABSTRACT

Recent advances in large language models (LLMs) have spurred growing interest in using LLM-integrated agents for social simulation, often under the implicit assumption that realistic population dynamics will emerge once role-specified agents are placed in a networked multi-agent setting. This position paper argues that LLM-based agents are not (yet) a panacea for social simulation. We attribute this over-optimism to a systematic mismatch between what current agent pipelines are typically optimized and validated to produce and what simulation-as-science requires. Concretely, role-playing plausibility does not imply faithful human behavioral validity; collective outcomes are frequently mediated by agent-environment co-dynamics rather than agent-agent messaging alone; and results can be dominated by interaction protocols, scheduling, and initial information priors, especially in policy-oriented settings. To make these assumptions explicit and auditable, we propose a unified formulation of AI agent-based social simulation as an environment-involved partially observable Markov game with explicit exposure and scheduling mechanisms and call for further actions.

研究の動機と目的

  • エージェントの妥当性と忠実な社会シミュレーションとの認知的ギャップを強調する。
  • 環境・スケジューリング・情報曝露が集合的アウトカムを媒介する様子を診断する。
  • 統一的な環境関与型エージェントベースの社会シミュレータ定式化を提案する。
  • シミュレーションの信頼性・解釈可能性・認知的厳密性を向上させるためのアクションを示す。

提案手法

  • 現在のLLMベースの社会シミュレーションパイプラインをレビューし、個体レベル対集合レベルのアプローチで分類する。
  • ロールプレイの妥当性と制約下での忠実な意思決定との間の根本的な不一致を特定する。
  • 明示的な状態・環境・スケジューラ・可視性・遷移部品を含む環境関与AIエージェントベース社会シミュレータの定義を導入する。
  • エージェントポリシー・メンタル状態・観測・環境遷移が正式化されたループの下でどのように相互作用するかを説明する。
  • 解釈可能性と堅牢性を改善するために、エージェント生成と環境介在メカニズムを分離するべきであると主張する。

実験結果

リサーチクエスチョン

  • RQ1現在のLLMベースのエージェントパイプラインと社会シミュレーションの認知的目標との間にどのような不一致が存在するのか?
  • RQ2環境-エージェント共ダイナミクスと情報曝露を明示的にモデル化するように社会シミュレーションを再設計するにはどうすればよいか?
  • RQ3AIエージェント社会シミュレータの信頼性・解釈可能性・反事実的頑健性を改善するために具体的にどのような行動が必要か?

主な発見

  • ロールプレイの妥当性は人間の忠実なシミュレーションを意味しない。
  • 社会的アウトカムはエージェントのメッセージだけでなく、環境や制度的制約によって媒介されることが多い。
  • 現在の評価実践は分断されており、しばしば出力中心であり、脆弱または誤解を招く結論を生むリスクがある。
  • 統一された環境関与型定式化は、曝露・スケジューリング・インセンティブをエージェント言語生成から分離し、因果関係と堅牢性を向上させる。
  • 環境・可視性・スケジューリングを明示的にモデル化することで、プロンプトやインターフェース由来のアーティファクトをシミュレーションから低減できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。