Skip to main content
QUICK REVIEW

[논문 리뷰] IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference

Guanming Liu, Meng Wu|arXiv (Cornell University)|2026. 02. 10.
Explainable Artificial Intelligence (XAI)인용 수 0
한 줄 요약

IntPro는 사용자의 의도 기록을 이용해 사용 의도를 추론하고 설명하는 검색 기반 프록시 에이전트를 도입하며, 인간-프록시-LLM 프레임워크 내에서 직접 추론과 검색 기반 추론을 결합한다.

ABSTRACT

Large language models (LLMs) have become integral to modern Human-AI collaboration workflows, where accurately understanding user intent serves as a crucial step for generating satisfactory responses. Context-aware intent understanding, which involves inferring user intentions from situational environments, is inherently challenging because it requires reasoning over both the immediate context and the user's underlying motivations that drive their behavior. Moreover, existing approaches often treat intent understanding as a static recognition task, overlooking users' accumulated intent patterns that could provide valuable references for more accurate and generalizable understanding. To address this gap, we propose IntPro, a proxy agent that learns to adapt to individual users via retrieval-conditioned intent inference. We design intent explanations that abstract how contextual signals connect to expressed intents, and store them in an individual intent history library for retrieval. We train IntPro through supervised fine-tuning on retrieval-conditioned trajectories and multi-turn Group Relative Policy Optimization (GRPO) with tool-aware reward functions, enabling the agent to learn when to leverage historical intent patterns and when to infer directly. Experiments across three diverse scenarios (Highlight-Intent, MIntRec2.0, and Weibo Post-Sync) demonstrate that IntPro achieves strong intent understanding performance with effective context-aware reasoning capabilities across different scenarios and model types.

연구 동기 및 목표

  • 상호 작용 기록과 상황 맥락을 활용해 컨텍스트 인식 의도 이해를 동기부여한다.
  • LLM 응답을 안내하기 위해 의도 라벨과 자연어 설명을 생성할 수 있는 프록시 에이전트를 개발한다.
  • 의도 히스토리 라이브러리에서 사용자별 의도 패턴을 저장하고 검색해 개인화를 가능하게 한다.
  • 검색 조건 추론을 위한 감독 학습 미세조정과 강화 학습을 결합하는 학습 프레임워크를 설계한다.

제안 방법

  • 맥락과 의도를 설명 텍스트를 수반하는 라벨로 정의한다.
  • (사용자, 의도 라벨, 설명)을 저장하는 per-user 의도 이력 라이브러리를 구성한다.
  • 교사 모델과 검색 도구를 사용해 유사한 과거 패턴을 검색하여 검색 조건 추론 트라이젝터리(trajectory)를 생성한다.
  • 검색 조건 추론 트라이젝터리에서 감독 학습으로 모델을 미세조정한다.
  • 도구 인식 보상 함수를 사용한 GRPO를 적용해 직접 추론과 검색 기반 전략의 균형을 맞춘다.
  • 감독 학습 미세조정에 이어 강화 학습을 수행하는 2단계 학습 파이프라인을 사용한다.
Figure 1. Current Human-LLM Collaboration (A) VS Human-Proxy-LLM Collaboration with context-aware intent understanding (B).
Figure 1. Current Human-LLM Collaboration (A) VS Human-Proxy-LLM Collaboration with context-aware intent understanding (B).

실험 결과

연구 질문

  • RQ1프록시 에이전트가 현재 맥락과 개인화된 의도 이력을 통합해 사용 의도를 어떻게 추론하고 설명할 수 있을까?
  • RQ2검색 조건 기반 설명이 정적 인식에 비해 다양한 시나리오에서 의도 이해를 향상시킬 수 있을까?
  • RQ3다양한 맥락의 난이도에 따라 직접 추론과 검색 기반 추론 간의 학습 균형을 어떻게 해야 하는가?
  • RQ4개인화된 의도 설명이 검색 정확도와 일반화에 어떤 영향을 미치는가?
  • RQ5도구 인식 보상과 함께 GRPO가 검색 조건 의도 추론 최적화에 얼마나 효과적일까?

주요 결과

  • IntPro는 맥락 신호를 표현된 의도와 연결하는 의도 라벨과 설명을 생성하는 방법을 학습한다.
  • 검색 이력이 개인화된 의도 패턴 매칭을 가능하게 하고 검색 정확도를 향상시킨다.
  • 프레임워크는 직접 추론과 검색 조건 추론을 모두 지원하며 맥락 난이도에 따라 조정된다.
  • 다양한 시나리오에 걸친 실험에서 강력한 의도 이해와 맥락 인식 추론이 모델 유형에 걸쳐 나타난다.
  • 도구 인식 보상을 갖춘 GRPO는 에이전트가 추론 전략의 균형을 효과적으로 조정하도록 이끈다.
Figure 2. Overview of our data construction pipeline for context-aware intent understanding, including intent history library construction and retrieval-conditioned intent inference trajectory generation.
Figure 2. Overview of our data construction pipeline for context-aware intent understanding, including intent history library construction and retrieval-conditioned intent inference trajectory generation.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.