[논문 리뷰] AgentRaft: Automated Detection of Data Over-Exposure in LLM Agents
AgentRaft는 Cross-tool 함수 호출 그래프를 구축하고 결정론적 프롬프트를 합성하며 다중 LLM 투표 위원회를 사용하여 GDPR/CCPA/PIPL에 따라 데이터 흐름을 감시함으로써 LLM 에이전트에서 Data Over-Exposure (DOE)를 자동으로 탐지합니다. DOE가 일반적이며 대규모에서 효율적으로 탐지될 수 있음을 보여줍니다.
The rapid integration of Large Language Model (LLM) agents into autonomous task execution has introduced significant privacy concerns within cross-tool data flows. In this paper, we systematically investigate and define a novel risk termed Data Over-Exposure (DOE) in LLM Agent, where an Agent inadvertently transmits sensitive data beyond the scope of user intent and functional necessity. We identify that DOE is primarily driven by the broad data paradigms in tool design and the coarse-grained data processing inherent in LLMs. In this paper, we present AgentRaft, the first automated framework for detecting DOE risks in LLM agents. AgentRaft combines program analysis with semantic reasoning through three synergistic modules: (1) it constructs a Cross-Tool Function Call Graph (FCG) to model the interaction landscape of heterogeneous tools; (2) it traverses the FCG to synthesize high-quality testing user prompts that act as deterministic triggers for deep-layer tool execution; and (3) it performs runtime taint tracking and employs a multi-LLM voting committee grounded in global privacy regulations (e.g., GDPR, CCPA, PIPL) to accurately identify privacy violations. We evaluate AgentRaft on a testing environment of 6,675 real-world agent tools. Our findings reveal that DOE is indeed a systemic risk, prevalent in 57.07% of potential tool interaction paths. AgentRaft achieves a high detection accuracy and effectiveness, outperforming baselines by 87.24%. Furthermore, AgentRaft reaches near-total DOE coverage (99%) within only 150 prompts while reducing per-chain verification costs by 88.6%. Our work provides a practical foundation for building auditable and privacy-compliant LLM agent systems.
연구 동기 및 목표
- LLM 에이전트에서 Data Over-Exposure (DOE)를 형식적으로 정의하고 교차 도구 데이터 흐름 전반에 걸친 위험을 정량화한다.
- 교차 도구 함수 호출 그래프, 프롬프트 합성, 런타임 데이터 흐름 타인팅을 사용하여 DOE를 자동으로 감지하도록 AgentRaft를 개발한다.
- GDPR, CCPA, PIPL에 의해 안내되는 다중 LLM 투표 위원회를 통해 프라이버시 준수를 강제한다.
- DOE 커버리지, 탐지 효율성, 감사 비용 절감을 측정하기 위해 대규모 실제 도구 세트에서 AgentRaft를 평가한다.
제안 방법
- LLM 에이전트의 도구 간 데이터 의존성을 모델링하기 위해 Cross-Tool Function Call Graph (FCG)를 구축한다.
- 정적 함수 쌍 의존성 분석 및 LLM-검증 의존성 가지치기를 수행하여 유효한 호출 체인을 정의한다.
- 높은 유효성을 가진 소스에서 싱크까지의 호출 체인 프롬프트를 합성하여 심층 도구 실행을 결정적으로 트리거한다.
- 런타임 환경에서 taint-tracking을 실행하여 소스에서 싱크까지의 데이터 전파를 모니터링한다.
- GDPR/CCPA/PIPL에 의해 안내되는 다중 LLM 투표 위원회를 적용하여 데이터 필요성 (D_nec)를 판단하고 DOE (D_trans outside D_int and D_nec)를 탐지한다.
- 6,675 도구와 네 가지 에이전트 시나리오에 걸쳐 DOE 탐지 효율성 및 비용 절감을 평가한다.
실험 결과
연구 질문
- RQ1LLM 에이전트의 교차 도구 데이터 흐름에서 Data Over-Exposure의 보편성은 어느 정도인가?
- RQ2다양한 도구 생태계에서 기준선과 비교했을 때 AgentRaft의 DOE 탐지가 얼마나 효과적인가?
- RQ3단일 모델 판사에 비해 다중 LLM 투표 메커니즘이 DOE 판단 정확도를 얼마나 향상시키는가?
- RQ4스케일링된 자동 프라이버시 감사의 효율성 및 비용 이점은 무엇인가?
주요 결과
- DOE는 시스템적 위험이며, 잠재적 도구 호출 경로의 57.07%가 민감 데이터를 노출한다.
- 전송된 데이터 필드의 65.42%가 과노출로 식별된다.
- AgentRaft는 50 프롬프트에서 69.15% 탐지, 150 프롬프트에서 약 99% 커버리지를 달성한다.
- 다중 LLM 투표는 150 프롬프트 내에서 DOE 식별을 87.24% 향상시킨다.
- 가이드되지 않은 기준선에 비해 도구 체인당 감사 비용이 88.6% 감소한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.