[논문 리뷰] Atomizer: An LLM-based Collaborative Multi-Agent Framework for Intent-Driven Commit Untangling
Atomizer는 Intent-Oriented CoT prompting과 grouper-reviewer 정제 루프를 활용하는 다중 에이전트 프레임워크를 도입하여 복합 커밋의 해소를 달성하고, 특히 복잡한 커밋에서 정확도 면에서 최첨단 그래프 기반 방법들을 능가한다.
Composite commits, which entangle multiple unrelated concerns, are prevalent in software development and significantly hinder program comprehension and maintenance. Existing automated untangling methods, particularly state-of-the-art graph clustering-based approaches, are fundamentally limited by two issues. (1) They over-rely on structural information, failing to grasp the crucial semantic intent behind changes, and (2) they operate as ``single-pass'' algorithms, lacking a mechanism for the critical reflection and refinement inherent in human review processes. To overcome these challenges, we introduce Atomizer, a novel collaborative multi-agent framework for composite commit untangling. To address the semantic deficit, Atomizer employs an Intent-Oriented Chain-of-Thought (IO-CoT) strategy, which prompts large language models (LLMs) to infer the intent of each code change according to both the structure and the semantic information of code. To overcome the limitations of ``single-pass'' grouping, we employ two agents to establish a grouper-reviewer collaborative refinement loop, which mirrors human review practices by iteratively refining groupings until all changes in a cluster share the same underlying semantic intent. Extensive experiments on two benchmark C# and Java datasets demonstrate that Atomizer significantly outperforms several representative baselines. On average, it surpasses the state-of-the-art graph-based methods by over 6.0% on the C# dataset and 5.5% on the Java dataset. This superiority is particularly pronounced on complex commits, where Atomizer's performance advantage widens to over 16%.
연구 동기 및 목표
- 소프트웨어 저장소에서 복합 커밋과 그 유지 관리 부담의 문제를 동기화합니다.
- 기존 untangling 방법의 두 가지 핵심 한계인 의미 이해와 반복적 정제의 부재를 다룹니다.
- IO-CoT 및 정제 루프를 활용하는 다중 에이전트 프레임워크(Purifier, Profiler, Grouper, Reviewer)를 제안합니다.
- 벤치마크 C# 및 Java 데이터셋에서 기준선 대비 실험적 이득을 보여줍니다.
제안 방법
- Purifier는 가장 중요한 구조적 변화를 포착하기 위해 Minimal Change Subgraphs (MCSs)를 구성합니다.
- Profiler는 Intent-Oriented Chain-of-Thought (IO-CoT)를 적용하여 각 MCS의 의미 의도를 추론합니다.
- Grouper는 의도 기반 탐욕적 그룹화를 수행합니다; Reviewer는 루프에서 그룹을 다듬기 위한 피드백을 제공합니다.
- 반복적 Grouper-Reviewer 정제 루프가 의미적으로 일관된 원자 커밋으로収束합니다.
- 평가는 C# 및 Java 데이터셋에서 Atomizer를 최첨단 baselines와 비교하고 변경 노드 정확도를 보고합니다.
실험 결과
연구 질문
- RQ1개발자 의도를 구조적 신호를 넘어 자동 커밋 untangling에 어떻게 효과적으로 반영할 수 있는가?
- RQ2단일 패스 방법에 비해 반복적 Grouper-Reviewer 정제 루프가 그룹화 품질을 개선하는가?
- RQ3IO-CoT 기반의 의미 추론이 복합 커밋의 untangling 정확도에 어떤 영향을 미치는가?
- RQ4벤치마크 C# 및 Java 데이터셋에서 Atomizer의 성능은 복잡한 커밋을 포함하여 SOTA 그래프 기반 방법에 비해 어떤가?
주요 결과
- Atomizer는 평균 변경 노드 예측 정확도 57%를 달성합니다.
- Atomizer는 C# 데이터셋에서 SOTA baselines에 비해 ≥6.0% 향상, Java 데이터셋에서 ≥5.5% 향상으로 크게 앞섭니다.
- 복잡한 커밋에서 특히 성능 이점이 두드러지며, 향상 폭이 16%를 넘습니다.
- 이 프레임워크는 IO-CoT 추론과 Grouper-Reviewer 루프를 통합하여 의미론적 한계를 완화하고 반복적 정제를 가능하게 합니다.
- 두 개의 널리 사용되는 벤치마크 데이터셋에 대한 실험은 기존 그래프 기반 접근법에 비해 견고한 개선을 보여줍니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.