[논문 리뷰] Opinion Consensus Formation Among Networked Large Language Models
본 논문은 다양한 그래프 위상에서 DeGroot 프레임워크하에 LLM 기반 에이전트가 합의에 도달하는 방식을 연구하고, 합의를 얻지만 최종 의견이 DeGroot 예측과 다르고 수렴 속도가 그래프 고유값과 연관된다는 것을 발견한다.
Can classical consensus models predict the group behavior of large language models (LLMs)? We examine multi-round interactions among LLM agents through the DeGroot framework, where agents exchange text-based messages over diverse communication graphs. To track opinion evolution, we map each message to an opinion score via sentiment analysis. We find that agents typically reach consensus and the disagreement between the agents decays exponentially. However, the limiting opinion departs from DeGroot's network-centrality-weighted forecast. The consensus between LLM agents turns out to be largely insensitive to initial conditions and instead depends strongly on the discussion subject and inherent biases. Nevertheless, transient dynamics align with classical graph theory and the convergence rate of opinions is closely related to the second-largest eigenvalue of the graph's combination matrix. Together, these findings can be useful for LLM-driven social-network simulations and the design of resource-efficient multi-agent LLM applications.
연구 동기 및 목표
- 다중 라운드 상호작용에서 DeGroot 합의가 LLM 에이전트의 집단 행동을 예측하는지 평가한다.
- 네트워크 토폴로지와 프롬프트가 LLM 간 의견 수렴에 어떤 영향을 미치는지 조사한다.
- LLM 에이전트의 최종 의견에서 주제 의존적 고유 편향을 탐구한다.
- 수렴 속도를 정량화하고 이를 상호 작용 그래프의 스펙트럼 특성과 연관시킨다.
- 추가 연구를 위한 LLM-네트워크 실험의 개방적이고 대규모 데이터셋을 제공한다.
제안 방법
- 지시된 가중 그래프에서 텍스트 기반 메시지를 교환하는 DeGroot 참가자로 LLM 에이전트를 모델링한다.
- 시스템 프롬프트를 통해 네트워크 가중치와 에이전트 성격을 강제하고 실험 동안 결합 행렬 A를 고정한다.
- 각 메시지를 별도의 감성 분석 LLM을 사용해 의견 점수로 매핑하고 [0,1]의 정규화된 점수를 산출한다.
- 토폴로지 효과를 연구하기 위해 Erdős–Rényi 그래프(연결성 p), 완전 연결 그래프, 링 토폴로지를 사용한다.
- 에이전트를 토론 가능한 입장(찬성, 중립, 반대)으로 초기화하고 주제를 다양하게 바꿔 편향과 수렴을 연구한다.
- Hugging Face에서 764 experiments와 over 1.2 million LLM responses로 데이터셋을 오픈 소스화한다.

실험 결과
연구 질문
- RQ1네트워크에서 다중 라운드 LLM 상호작용이 DeGroot 유사 업데이트 하에 합의로 수렴하는가?
- RQ2그래프 토폴로지와 상호작용 가중치가 LLM 에이전트의 수렴 속도와 최종 의견에 어떤 영향을 미치는가?
- RQ3최종 의견이 DeGroot의 네트워크 중심성 가중 예측과 일치하는가, 아니면 주제 및 프리트레이닝 정렬에 의해 편향되는가?
- RQ4수렴 속도와 결합 행렬의 두 번째로 큰 고유값 사이의 실증적 관계는 무엇인가?
- RQ5가중치를 강제하는 시스템 프롬프트가 합의 형성에 어떤 영향을 미치는가?
주요 결과
| 실험 유형 | 평균 표준편차 ± 표준오차 |
|---|---|
| Weighted Experiments | 0.083 ± 0.004 |
| Weightless Experiments | 0.165 ± 0.008 |
- 에이전트는 일반적으로 합의에 수렴하며 불일치가 지수적으로 감소한다.
- 최종 합의는 종종 DeGroot가 예측한 네트워크 중심성 가중 평균 초기 의견과 다르게 나타난다.
- 최종 의견은 프리트레이닝 및 정렬 편향에 의해 주제 의존적 편향을 보인다.
- 수렴 속도는 고전 그래프 이론과 일치하며 결합 행렬의 두 번째 큰 고유값의 크기와 관련이 있다.
- 시스템 프롬프트를 통해 가중치를 강제하면 합의에 이를 가능성이 증가한다.
- 불일치의 반감 시간은 두 번째 고유값을 고려할 때 이론적 관계 t1/2 = ln(2)/(-ln|λ2|) 와 일치한다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.