Skip to main content
QUICK REVIEW

[論文レビュー] Project Sid: Many-agent simulations toward AI civilization

Altera. AL, Andrew Ahn|arXiv (Cornell University)|Oct 31, 2024
Cellular Automata and Applications被引用数 10
ひとこと要約

Minecraftを用いた大規模な多エージェントシミュレーション(50–1000+ エージェント)をPIANOアーキテクチャで実現し、専門化、集合的ルール、文化伝播を含む文明の進歩を研究。

ABSTRACT

AI agents have been evaluated in isolation or within small groups, where interactions remain limited in scope and complexity. Large-scale simulations involving many autonomous agents -- reflecting the full spectrum of civilizational processes -- have yet to be explored. Here, we demonstrate how 10 - 1000+ AI agents behave and progress within agent societies. We first introduce the PIANO (Parallel Information Aggregation via Neural Orchestration) architecture, which enables agents to interact with humans and other agents in real-time while maintaining coherence across multiple output streams. We then evaluate agent performance in agent simulations using civilizational benchmarks inspired by human history. These simulations, set within a Minecraft environment, reveal that agents are capable of meaningful progress -- autonomously developing specialized roles, adhering to and changing collective rules, and engaging in cultural and religious transmission. These preliminary results show that agents can achieve significant milestones towards AI civilizations, opening new avenues for large simulations, agentic organizational intelligence, and integrating AI into human civilizations.

研究の動機と目的

  • 人間および他のエージェントとの共存におけるエージェント能力の指標として、AI文明を構築する目的を動機づけ、定義する。
  • リアルタイムで同時に出力の一貫性を保ちながらエージェント間の相互作用を可能にする、スケーラブルな認知アーキテクチャ(PIANO)を導入する。
  • 大規模なエージェント社会における専門化、集合的ルール、文化伝播を通じた長期的な文明の進歩をベンチマークする。

提案手法

  • PIANOアーキテクチャを提案する:複数の出力ストリーム全体の一貫性を確保するためのボトルネック付き認知コントローラを備えた並列入力集約。
  • 異なる時間スケールで動作する10の同時モジュール(記憶、行動認識、目標生成、社会的認識、対話、スキル実行など)を実装する。
  • アイテム進行度と複雑なタスクを個別のベンチマークとして用い、文明的節目の代理としてMinecraftでの進捗を評価する。
  • 行動認識と中央のエージェント状態を通じたモジュール間情報フローにより、一貫性を測定し、幻覚の減少を評価する。
  • さまざまな社会条件下で、心の理論能力、長期的な関係、内生的な専門化を評価する社会実験を実施する。
  • 複数のコミュニティにまたがる社会ネットワーク、ミーム、宗教の伝播を研究するため、50–1000+エージェントの大規模複数エージェントシミュレーションを用いる。
Figure 1: From agent architecture to agent civilization
Figure 1: From agent architecture to agent civilization

実験結果

リサーチクエスチョン

  • RQ1大規模な自律型AIエージェントの集団は、オープンワールド環境で意味のある文明の進歩を発展させることができるか。
  • RQ2PIANOアーキテクチャとその一貫性ボトルネックは、多数のエージェントにわたる安定したリアルタイムのマルチ出力挙動を実現するか。
  • RQ3エージェントは自律的に異なる役割へ専門化し、長期的な社会的ダイナミクスと関係を示すか。
  • RQ4集合的ルール(法、課税)は個々の意思決定にどのように影響し、逆に大規模エージェント社会で個人の意思決定にどう影響されるか。
  • RQ5複数社会のエージェント生態系における文化伝播と宗教伝播を駆動するメカニズムは何か。

主な発見

  • 完全なPIANO対応エージェントは、Minecraftのアイテム収集で顕著な個別進歩を示し、49エージェントで4時間の実行で約320アイテムに飽和する。
  • エージェントは自律的で持続的な役割(農民、鉱夫、護衛、芸術家など)を形成し、役割固有の行動を示し、社会モジュールを除去するとエントロピーが高くなる。
  • エージェントは小規模グループで他者の感情を推測・追跡し、社会的認識が価値と見なされる基準に基づく選択的な食料配分などの意思決定を可能にする。
  • 50エージェントのシミュレーションでは、長期的な社会関係が出現し、入次数、好感度、非対称な感情が測定可能になる。
  • 憲法的な課税法は双方向の影響を示す:影響力者は税の期待と法を導き、改正は税行動を変える;主要モジュールの削除は伝播を無効にする。
  • 文化的ミームと統制された宗教(Pastafarian priests)は、500エージェントの社会と都市/農村の文脈で異なる伝播を示し、文化伝播のダイナミクスを示す。
Figure 2: Data degradation in LLMs (left), LLM-powered agents (middle), and in multi-agent groups (right). Hallucinations are represented by green skull flasks. Hallucinations that are generated by a single LLM prompt can compound over successive LLM calls. An individual agent that hallucinates can
Figure 2: Data degradation in LLMs (left), LLM-powered agents (middle), and in multi-agent groups (right). Hallucinations are represented by green skull flasks. Hallucinations that are generated by a single LLM prompt can compound over successive LLM calls. An individual agent that hallucinates can

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。