[論文レビュー] SWE-Hub: A Unified Production System for Scalable, Executable Software Engineering Tasks
tldr: SWE-Hub は、環境プロビジョニングの統合、スケーラブルなタスク合成、および多様なタスク生成を統合して大規模に実行可能な SWE タスクを生み出すエンドツーエンドのデータファクトリを導入します。共有実行基盤を構築し、修復、現実性駆動のリグレッション、長期的なリポジトリ構築の三つのタスク製品ラインを提供します。
Progress in software-engineering agents is increasingly constrained by the scarcity of executable, scalable, and realistic data for training and evaluation. This scarcity stems from three fundamental challenges in existing pipelines: environments are brittle and difficult to reproduce across languages; synthesizing realistic, system-level bugs at scale is computationally expensive; and existing data predominantly consists of short-horizon repairs, failing to capture long-horizon competencies like architectural consistency. We introduce extbf{SWE-Hub}, an end-to-end system that operationalizes the data factory abstraction by unifying environment automation, scalable synthesis, and diverse task generation into a coherent production stack. At its foundation, the extbf{Env Agent} establishes a shared execution substrate by automatically converting raw repository snapshots into reproducible, multi-language container environments with standardized interfaces. Built upon this substrate, extbf{SWE-Scale} engine addresses the need for high-throughput generation, combining cross-language code analysis with cluster-scale validation to synthesize massive volumes of localized bug-fix instances. extbf{Bug Agent} generates high-fidelity repair tasks by synthesizing system-level regressions involving cross-module dependencies, paired with user-like issue reports that describe observable symptoms rather than root causes. Finally, extbf{SWE-Architect} expands the task scope from repair to creation by translating natural-language requirements into repository-scale build-a-repo tasks. By integrating these components, SWE-Hub establishes a unified production pipeline capable of continuously delivering executable tasks across the entire software engineering lifecycle.
研究の動機と目的
- 研究目的と動機の要約
- 実行可能でスケーラブルなデータの不足に対処する
- 環境自動化、スケーラブルな合成、多様なタスク生成を生産スタックに統合する
- 再現性のあるタスクの標準化インターフェースと検証を備えた共通実行基盤を提供する
- 修復、リグレッションの現実性、長期的なリポジトリ構築を横断する複数のタスクファミリを提供する
提案手法
- Env Agent は原始リポジトリスナップショットを再現性のある多言語コンテナ環境へと変換し、標準化されたインターフェースを提供する
- SWE-Scale エンジンは、言語間分析と自動検証を通じて大規模な現地化バグ修正インスタンスを生成する
- Bug Agent は、根本原因のヒントを含まない症状を説明するユーザーのような問題レポートとともに、システムレベルのリグレッションを合成する
- SWE-Architect は自然言語要件をリポジトリ規模のゼロからビルドするタスクへ翻訳し、長期的なデータ生成を可能にする
- 全てのタスクラインは Kubernetes ベースの実行基盤、統一されたタスクスキーマ、再現性の検証ゲートを共有する

実験結果
リサーチクエスチョン
- RQ1実行可能で検証可能なタスクインスタンスを複数言語に跨って生のリポジトリから信頼性高く変換できるproduction system は作れるか
- RQ2スケーラブルな合成と現実的なバグ生成を、統一検証機の下で長期のリポジトリ構築タスクと統合できるか
- RQ3どのようなアーキテクチャ設計が、クロス言語の再現性、決定論的環境プロビジョニング、およびスケーラブルなタスク生成を SWE で可能にするか
主な発見
- 統一データファクトリ構造が、実行可能な SWE タスクのための環境設定、候補生成、検証を標準化するために提案されている
- 自動化された再現性基盤(Env Agent)は、環境準備とテスト正確性を切り離し、標準化されたエントリポイントを持つバージョン管理済みイメージを生成する
- 三つの製品ライン(SWE-Scale、Bug Agent、SWE-Architect)は、同一基盤上で修復志向の合成、現実味志向のリグレッション、長期的なリポジトリ構築を可能にする
- 検証は、様々なエコシステム全体で、ステートレスなワーカーと決定論的・機械可読出力を用いた第一級のスケーラビリティ課題として扱われる

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。