[논문 리뷰] Position: AI Agents Are Not (Yet) a Panacea for Social Simulation
이 논문은 LLM 기반 에이전트가 신뢰할 수 있는 사회 시뮬레이션에 충분하지 않다고 주장하고, 그럴듯한 행동과 기계적, 정책 관련 추론 사이의 불일치를 다루기 위해 환경이 관여된 에이전트 기반 프레임워크를 제안한다.
Recent advances in large language models (LLMs) have spurred growing interest in using LLM-integrated agents for social simulation, often under the implicit assumption that realistic population dynamics will emerge once role-specified agents are placed in a networked multi-agent setting. This position paper argues that LLM-based agents are not (yet) a panacea for social simulation. We attribute this over-optimism to a systematic mismatch between what current agent pipelines are typically optimized and validated to produce and what simulation-as-science requires. Concretely, role-playing plausibility does not imply faithful human behavioral validity; collective outcomes are frequently mediated by agent-environment co-dynamics rather than agent-agent messaging alone; and results can be dominated by interaction protocols, scheduling, and initial information priors, especially in policy-oriented settings. To make these assumptions explicit and auditable, we propose a unified formulation of AI agent-based social simulation as an environment-involved partially observable Markov game with explicit exposure and scheduling mechanisms and call for further actions.
연구 동기 및 목표
- 에이전트의 가능성과 충실한 사회 시뮬레이션 사이의 지식 격차를 강조한다.
- 환경, 스케줄링, 정보 노출이 집합적 결과를 매개하는 방법을 진단한다.
- 환경에 의해 관여되는 에이전트 기반 사회 시뮬레이터의 통합 형식을 제안한다.
- 시뮬레이션의 신뢰성, 해석 가능성 및 지식론적 엄밀성을 향상시키기 위한 조치를 제안한다.
제안 방법
- 현재 LLM 기반의 사회 시뮬레이션 파이프라인을 검토하고 이를 개인 차원과 집단 차원의 접근 방식으로 분류한다.
- 역할 연기 가능성과 제약 하에서의 충실한 의사결정 사이의 근본적인 불일치를 식별한다.
- 상태, 환경, 스케줄러, 가시성 및 전이 구성요소를 명시적으로 포함하는 환경에 관여된 AI 에이전트 기반 사회 시뮬레이터 정의를 도입한다.
- 에이전트 정책, 정신 상태, 관찰 및 환경 전이가 형식화된 루프 하에서 어떻게 상호 작용하는지 설명한다.
- 해석 가능성과 견고성을 높이기 위해 에이전트 생성을 환경 매개 메커니즘과 분리하는 것을 주장한다.
실험 결과
연구 질문
- RQ1현재 LLM 기반 에이전트 파이프라인과 사회 시뮬레이션의 인식론적 목표 사이에 어떤 불일치가 존재하는가?
- RQ2환경–에이전트 공동역동 및 정보 노출을 명시적으로 모델링하도록 사회 시뮬레이션을 어떻게 재구성할 수 있는가?
- RQ3AI-에이전트 사회 시뮬레이터의 신뢰성, 해석 가능성 및 반사실적 강건성을 높이기 위해 어떤 구체적 조치가 필요한가?
주요 결과
- 역할 연기 가능성은 충실한 인간 시뮬레이션을 의미하지 않는다.
- 사회적 결과는 종종 에이전트 메시지뿐만 아니라 환경 및 제도적 제약에 의해 매개된다.
- 현재 평가 관행은 단편적이고 종종 출력 중심이어서 취약하거나 오해의 소지가 있는 결론으로 이어질 위험이 있다.
- 통합된 환경 관여형 공식화는 노출, 스케줄링 및 인센티브를 에이전트 언어 생성으로부터 분리하여 인과관계 및 견고성을 향상시킬 수 있다.
- 환경, 가시성 및 스케줄링을 명시적으로 모델링하면 시뮬레이션에서 프롬프트 및 인터페이스로 인한 인위적 결과를 줄일 수 있다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.