QUICK REVIEW

[論文レビュー] SPEAR: An Engineering Case Study of Multi-Agent Coordination for Smart Contract Auditing

Arnab Mallick, Indraveni Chebolu|arXiv (Cornell University)|Feb 4, 2026

Multi-Agent Systems and Negotiation被引用数 0

ひとこと要約

SPEAR は、自律的なスマートコントラクト監査のための五エージェント MAS フレームワークを導入し、計画、実行、修復、作動、協調エージェントを備え、ベースラインと比較して故障に対する効果と頑健性が優れたことを示します。

ABSTRACT

We present SPEAR, a multi-agent coordination framework for smart contract auditing that applies established MAS patterns in a realistic security analysis workflow. SPEAR models auditing as a coordinated mission carried out by specialized agents: a Planning Agent prioritizes contracts using risk-aware heuristics, an Execution Agent allocates tasks via the Contract Net protocol, and a Repair Agent autonomously recovers from brittle generated artifacts using a programmatic-first repair policy. Agents maintain local beliefs updated through AGM-compliant revision, coordinate via negotiation and auction protocols, and revise plans as new information becomes available. An empirical study compares the multi-agent design with centralized and pipeline-based alternatives under controlled failure scenarios, focusing on coordination, recovery behavior, and resource use.

研究の動機と目的

確立された MAS 協調パターンが現実的なセキュリティワークフローにおける自律的スマートコントラクト監査へ適用できることを示す。
情報の変化に対応して監査の優先度を決めるリスク認識型 Planning Agent を開発する。
壊れやすいアーティファクトを回復するプログラム主導の修復方針（PFIR）を備えた Repair Agent を実装する。
故障時の自律的回復とリソース仲裁を可能にする協調フレームワークを示す。
協調と回復に焦点を当てて、SPEAR を中央集権的およびパイプライン型の代替案と経験的に比較する。

提案手法

監査を Planning、Execution、Repair、Safe Actuation、Coordinator の専門エージェントが担う任務としてモデル化する。
エージェントの局所信念には AGM 準拠の信念改訂を、意思決定には決定論的ポリシーを使用する。
Plan Negotiation、Contract Net、Resource Auction のプロトコルを用いて協調する。
壊れやすい生成アーティファクトを修復するプログラム主導の修復方針（PFIR）を実装する。
Damn Vulnerable DeFi ベンチマークでベースラインと比較して SPEAR を経験的に評価する。
MAS の formal モデリング（状態、イベント、信念、目標、プロトコル）を提供し、デッドロック自由性と有界終了などの特性を証明する。

Figure 1: SPEAR architecture: five specialized agents ( $A_{P}$ , $A_{E}$ , $A_{R}$ , $A_{C}$ , $A_{Coord}$ ) interact through a message bus, coordinating via Contract Net, plan negotiation, and resource auctions.

実験結果

リサーチクエスチョン

RQ1同一の分析ロジック下で MAS 協調構造は監査タスクの進行にどのような影響を与えるか？
RQ2生成アーティファクトの失敗から PFIR 自己修復アルゴリズムはどれだけ回復に寄与するか？
RQ3Strategic Planning Agent は監査の効率、特に初期の重大脆弱性までの時間を改善するか？
RQ4MAS の構成要素（プロトコル、自治、自己修復）は故障時のシステム堅牢性にどのように寄与するか？

主な発見

Approach	Precision	Recall	F1-Score
Slither only	0.82	0.65	0.73
Slither + Mythril	0.84	0.72	0.78
Sequential Pipeline	0.86	0.78	0.82
Centralized Scheduler	0.85	0.81	0.83
SPEAR (Full Framework)	0.89	0.85	0.87

SPEAR は、中央集権的スケジューラを含むすべてのベースラインよりも全体的な有効性が高い。
PFIR は生成アーティファクトの失敗から一貫して回復し、ほとんどの修復が生成的修復へエスカレートする前に決定論的である。
Planning Agent は高リスク脆弱性の早期発見を可能にし、初期の重大脆弱性までの時間を短縮する。
アブレーション研究は、プロトコル、自治、自己修復が回復時間を大幅に改善し、LLM 呼び出しを減少させることを示す。
完全な SPEAR は、プロトコル、自治、自己修復を欠く構成よりも回復が速く（2.3 分）、協調オーバーヘッドが低い。
注入された故障下で、MAS 構成は中央集権ベースラインよりも分散性が小さく安定した進行を示す。

Figure 2: Performance of the PFIR self-healing algorithm. The programmatic-first echelon resolves most failures, achieving consistent success across batches.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。