QUICK REVIEW

[論文レビュー] Atomizer: An LLM-based Collaborative Multi-Agent Framework for Intent-Driven Commit Untangling

Kangchen Zhu, Zhiliang Tian|arXiv (Cornell University)|Jan 3, 2026

Software Engineering Research被引用数 0

ひとこと要約

Atomizer は Intent-Oriented CoT prompting を用いるマルチエージェントフレームワークと grouper-reviewer 改善ループを導入し、複合コミットを解きほぐす。最先端のグラフベース手法に比べて精度が向上し、特に複雑なコミットで顕著。

ABSTRACT

Composite commits, which entangle multiple unrelated concerns, are prevalent in software development and significantly hinder program comprehension and maintenance. Existing automated untangling methods, particularly state-of-the-art graph clustering-based approaches, are fundamentally limited by two issues. (1) They over-rely on structural information, failing to grasp the crucial semantic intent behind changes, and (2) they operate as ``single-pass'' algorithms, lacking a mechanism for the critical reflection and refinement inherent in human review processes. To overcome these challenges, we introduce Atomizer, a novel collaborative multi-agent framework for composite commit untangling. To address the semantic deficit, Atomizer employs an Intent-Oriented Chain-of-Thought (IO-CoT) strategy, which prompts large language models (LLMs) to infer the intent of each code change according to both the structure and the semantic information of code. To overcome the limitations of ``single-pass'' grouping, we employ two agents to establish a grouper-reviewer collaborative refinement loop, which mirrors human review practices by iteratively refining groupings until all changes in a cluster share the same underlying semantic intent. Extensive experiments on two benchmark C# and Java datasets demonstrate that Atomizer significantly outperforms several representative baselines. On average, it surpasses the state-of-the-art graph-based methods by over 6.0% on the C# dataset and 5.5% on the Java dataset. This superiority is particularly pronounced on complex commits, where Atomizer's performance advantage widens to over 16%.

研究の動機と目的

ソフトウェアリポジトリにおける複合コミットとその保守負荷の問題を動機付ける。
既存の解きほぐし手法の2つの重要な制限：意味理解と反復的改良の欠如を指摘する。
IO-CoT と改良ループを活用するマルチエージェントフレームワーク（Purifier、Profiler、Grouper、Reviewer）を提案する。
ベンチマークの C# および Java データセットでベースラインを上回る経験的成果を示す。

提案手法

Purifier は最小変更サブグラフ（MCS）を構築して本質的な構造変化を捉える。
Profiler は Intent-Oriented Chain-of-Thought（IO-CoT）を適用して各 MCS の意味的意図を推測する。
Grouper は意図駆動の貪欲グルーピングを行い、Reviewer はグループをループ内で改良するフィードバックを提供する。
反復的な grouper-reviewer 改善ループは意味的に整合した原子コミットへ収束する。
評価では Atomizer を C# および Java データセットで最先端のベースラインと比較し、変更ノードの精度を報告する。」],
research_questions}:["開発者の意図を構造的信号を超えて自動的なコミット解きほぐしにいかに効果的に組み込めるか。","反復的な grouper-reviewer 改善ループは単一パス手法よりグルーピング品質を向上させるか。","IO-CoT 主導の意味理解は複合コミットの解きほぐしの精度にどのような影響を与えるか。","Atomizer のベンチマーク C# および Java データセットにおける SOTA グラフベース手法との性能はどの程度か、特に複雑なコミットを含む場合。"]
key_findings:[
,
]},
table_headers:[],
table_rows: []}result_output

実験結果

リサーチクエスチョン

RQ1開発者の意図を構造的信号を超えて自動的なコミット解きほぐしにいかに効果的に組み込めるか。
RQ2反復的な grouper-reviewer 改善ループは単一パス手法よりグルーピング品質を向上させるか。
RQ3IO-CoT 主導の意味理解は複合コミットの解きほぐしの精度にどのような影響を与えるか。
RQ4Atomizer のベンチマーク C# および Java データセットにおける SOTA グラフベース手法との性能はどの程度か、特に複雑なコミットを含む場合。

主な発見

Atomizer は変更ノードの平均予測精度を 57% に達成。
Atomizer は C# データセットで最先端ベースラインを大幅に上回り（≥6.0% 改善）、Java データセットでも（≥5.5% 改善）。
複雑なコミットでは特に性能優位が顕著で、 gains が 16% を超える。
IO-CoT 推論と Grouper-Reviewer ループの統合により意味的欠陥を軽減し、反復的改良を可能にする。
2つの広く用いられるベンチマークデータセットで prior グラフベース手法より安定した改善を実証。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。