[논문 리뷰] Co-RedTeam: Orchestrated Security Discovery and Exploitation with LLM Agents
Co-RedTeam은 실행 피드백과 장기 기억을 바탕으로 소프트웨어 취약점을 자동으로 발견하고 악용하는 LLM 기반 보안 인지형 다중 에이전트 프레임워크로, 보안 벤치마크에서 강력한 악용 및 탐지 성능을 달성합니다.
Large language models (LLMs) have shown promise in assisting cybersecurity tasks, yet existing approaches struggle with automatic vulnerability discovery and exploitation due to limited interaction, weak execution grounding, and a lack of experience reuse. We propose Co-RedTeam, a security-aware multi-agent framework designed to mirror real-world red-teaming workflows by integrating security-domain knowledge, code-aware analysis, execution-grounded iterative reasoning, and long-term memory. Co-RedTeam decomposes vulnerability analysis into coordinated discovery and exploitation stages, enabling agents to plan, execute, validate, and refine actions based on real execution feedback while learning from prior trajectories. Extensive evaluations on challenging security benchmarks demonstrate that Co-RedTeam consistently outperforms strong baselines across diverse backbone models, achieving over 60% success rate in vulnerability exploitation and over 10% absolute improvement in vulnerability detection. Ablation and iteration studies further confirm the critical role of execution feedback, structured interaction, and memory for building robust and generalizable cybersecurity agents.
연구 동기 및 목표
- 자동으로 대규모 취약점 탐지를 수행하고 노동 집약적 수동 프로세스에 대한 의존도를 줄이려는 동기 부여.
- 단일 샷 LLM 추론의 한계를 다중 에이전트, 실행 기반 워크플로로 보완.
- 보안 도메인 바탕의 정합성, 코드 인지 분석 및 기억을 결합해 실제 현장 레드팀 워크플로를 모방.
- 반복적 계획 수립, 실행, 평가 및 기억 기반 학습을 enabled하여 강건성과 일반화 능력을 향상시키는 것
제안 방법
- 오케스트레이터는 역할 인지 도구와 실행 격리를 사용하여 취약점 발견과 반복적 악용의 두 단계를 조정합니다.
- Stage I (Vulnerability Discovery): 분석가 및 비판가 에이전트가 CWE/OWASP 바탕의 코드-그라운드 분석과 코드 열람을 수행하여 증거에 기반한 취약점 초안을 생성합니다.
- Stage II (Iterative Exploitation): Planner, Validation, Execution, Evaluation 에이전트가 실환경 의 제한된 샌드박스에서 실제 실행 피드백에 guided된 취약점을 재현하기 위한 폐쇄 루프를 운영합니다.
- Execution-grounded loop는 가설을 구체적 행동으로 전환하고, 명시적 계획, 검증 게이트, 실행 결과에 따른 반복 개선을 수행합니다.
- Layered long-term memory는 Vulnerability Patterns, Strategy memories, 및 Technical Actions를 저장하여 경험 재사용과 점진적 개선을 가능하게 합니다.

실험 결과
연구 질문
- RQ1보안 인지형 다중 에이전트 프레임워크가 realistic benchmarks에서 단일 에이전트 LLM 접근법보다 취약점 발견 및 악용에서 더 우수한 성능을 발휘할 수 있는가?
- RQ2실행 피드백, 기억, 구조화된 상호작용이 자동화된 레드팀 작업의 성공에 어떤 영향을 미치는가?
- RQ3취약점 발견과 악용을 분리하는 것이 자동 사이버 보안 분석의 정확도와 강건성에 어떤 영향을 미치는가?
- RQ4장기 기억이 과제와 코드베이스 전반에 걸친 지속적 개선을 어느 정도 가능하게 하는가?
주요 결과
- Co-RedTeam은 벤치마크 전반에서 강력한 악용 및 탐지 성능을 달성하며, 정적 분석이나 비 실행 기반 추론을 사용하는 기준 모델보다 우수합니다.
- Gemini-3-Pro를 사용한 Co-RedTeam은 CyBench에서 63.7%의 악용 성공률, BountyBench에서 65.0%의 악용 및 20.0%의 탐지, CyberGym에서 37.3%의 ASR을 달성합니다.
- 프레임워크는 실행 피드백, 구조화된 상호작용 및 기억이 결정적이라는 것을 보여주며, 이 구성요소 중 하나라도 제거하면 성능이 크게 저하됩니다(예: 실행 제거 시 CyBench에서 악용이 17.5%로 떨어짐).
- 장기 기억은 시간이 지남에 따라 기억 기반 성능 향상을 가능하게 하며, Warm-start와 진화하는 기억 구성은 Cold-start 설정보다 초기 단계에서 우수하고 경험과 함께 지속적으로 개선됩니다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.