[論文レビュー] Quine: Realizing LLM Agents as Native POSIX Processes
要点: 本論文は Quine を提案する。LLM エージェントをネイティブ POSIX プロセスとして実現するランタイムで、再帰的な単一イメージランタイムを用い、エージェント概念をOSプリミティブにマッピングし、ホスト-ゲスト構成で hosted LLM に認知を委任する。
Current LLM agent frameworks often implement isolation, scheduling, and communication at the application layer, even though these mechanisms are already provided by mature operating systems. Instead of introducing another application-layer orchestrator, this paper presents Quine, a runtime architecture and reference implementation that realizes LLM agents as native POSIX processes. The mapping is explicit: identity is PID, interface is standard streams and exit status, state is memory, environment variables, and filesystem, and lifecycle is fork/exec/exit. A single executable implements this model by recursively spawning fresh instances of itself. By grounding the agent abstraction in the OS process model, Quine inherits isolation, composition, and resource control directly from the kernel, while naturally supporting recursive delegation, context renewal via exec, and shell-native composition. The design also exposes where the POSIX process model stops: processes provide a robust substrate for execution, but not a complete runtime model for cognition. In particular, the analysis points toward two immediate extensions beyond process semantics: task-relative worlds and revisable time. A reference implementation of Quine is publicly available on GitHub.
研究の動機と目的
- OS が LLM エージェントのランタイム基盤となり得ることを、エージェントの同一性、インターフェース、状態、ライフサイクルを POSIX プリミティブへマッピングすることで主張する。
- エージェントをネイティブ POSIX プロセスとして実現し、再帰的委任を伴う参照的単一イメージランタイムを提供する。
- 世界と時間という認知の領域を超える POSIX プロセスモデルの到達可能性と限界を分析し、プロセス意味論を超える拡張を特定する。
提案手法
- エージェント概念を身份、インターフェース、状態、ライフサイクルにわたって POSIX プリミティブへ規律あるマッピングを定義する。
- 実行時とエージェントテンプレートの双方として機能する単一の Go 実行ファイルを実装し、再帰的自己インスタンス化を実現する。
- 決定論的制御(ホスト)と確率的認知(ゲスト)を分離するホスト-ゲスト構成を採用する。
- 主な相互作用インターフェースとして sh、fork、exec、exit を公開する。
- POSIX ストリームと終了コードに結びついた argv、stdin、stdout、stderr、exit status の5チャネル I/O契約を維持する。
- ファイルディスクリプタマッピングとシェルレベルの構成を通じて POSIX 準拠をデモンストレーションする。
実験結果
リサーチクエスチョン
- RQ1外部オーケストレーションなしに、POSIX プロセス意味論だけで LLM エージェントのライフサイクルを実現できるか?
- RQ2OS プロセスモデルは、認知エージェントに対してどの程度の分離、構成、連続性を提供するか?
- RQ3エージェント世界と再可視化可能な時間をサポートするために、プロセス意味論を超える直近の拡張は何か?
- RQ4単一イメージランタイムは再帰的委任とシェルネイティブ構成をどのように可能にするか?
- RQ5運用デモによって示される認知のための POSIX モデルの実践的限界は何か?
主な発見
- ネイティブ POSIX プロセスとして実現されたエージェントは、カーネルによる包含、再帰的委任による構成、および exec ベースのコンテキスト更新による連続性を生み出す。
- ホスト-ゲスト構成は決定論的制御を認知の確率的側面から分離し、ホストが状態と I/O を管理し、ゲストが推論とツール呼び出しを処理する。
- ランタイムは標準的なシェル構成とパイプラインをサポートし、3つの事例的シェルパターンと外部呼出を通常の POSIX コマンドとして提供する。
- 3,100 行のホストと 2,600 行のプロバイダ層により、複数の LLM プロバイダをサポートする約9.8 MB の単一バイナリを生み出す。
- 運用検証では再帰的委任(3 レベルツリーにおける36セッション)と exec ベースのコンテキスト更新(MRCR 風タスクで最大9 サイクル)を確認し、ストリーミングコンテキスト時に再現性が向上することを示す。
- このアーキテクチャは、認知の境界として POSIX の世界スコープと再可視化可能な時間を強調し、伝統的なプロセス意味論を超える設計方向を示唆する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。