[논문 리뷰] Human Tool: An MCP-Style Framework for Human-Agent Collaboration
본 논문은 인간을 호출 가능한 도구로 간주하는 MCP 스타일의 추상화인 Human Tool을 제안합니다. 이는 AI 주도 워크플로에서 성능을 향상시키고 AI 우위 과제에서의 작업 부하를 줄이는 것을 목표로 합니다. 통제된 연구는 더 나은 결과와 AI 전용 기준선보다 더 균형 잡힌 협업을 보여줍니다.
Human-AI collaboration faces growing challenges as AI systems increasingly outperform humans on complex tasks, while humans remain responsible for orchestration, validation, and decision oversight. To address this imbalance, we introduce Human Tool, an MCP-style interface abstraction, building on recent Model Context Protocol designs, that exposes humans as callable tools within AI-led, proactive workflows. Here, "tool" denotes a coordination abstraction, not a reduction of human authority or responsibility. Building on LLM-based agent architectures, we operationalize Human Tool by modeling human contributions through structured tool schemas of capabilities, information, and authority. These schemas enable agents to dynamically invoke human input based on relative strengths and reintegrate it through efficient, natural interaction protocols. We validate the framework through controlled studies in both decision-making and creative tasks, demonstrating improved task performance, reduced human workload, and more balanced collaboration dynamics compared to baseline systems. Finally, we discuss implications for human-centered AI design, highlighting how MCP-style human tools enable strong AI leadership while amplifying uniquely human strengths.
연구 동기 및 목표
- AI 우위 과제에서 조정을 AI로 이동시키려는 필요성을 제시하여 조정 병목 현상을 줄인다.
- AI가 인간 입력을 호출할 수 있도록 능력, 정보, 권한의 세 가지 차원으로 구조화된 Human Tool 추상화를 정의한다.
- 도구 스키마 및 호출 프로토콜을 갖춘 MCP 스타일 인터페이스로 Human Tool을 구현한다.
- 통제된 실험을 통해 Human Tool이 작업 성능을 향상시키고 지각되는 작업 부하를 낮춘다는 것을 입증한다.
제안 방법
- Capabiliti es, Information, Authority의 세 차원을 통해 인간 기여자를 나타내는 구조화되고 호출 가능한 추상화로서 Human Tool을 정의한다.
- 역할별 분석(계층적 작업 분석) 및 세 가지 호출 조건(능력 보완성, 정보 교환, 권한 통제)을 통해 Human Tool의 호출 시점을 결정한다.
- 상호작용 행동과 경량 가이드라인을 사용하여 인간과의 의사소통 패턴을 확립하고 조정 오버헤드를 최소화한다.
- Python 백엔드(LangGraph), GPT-4o 추론, MySQL 저장소, 구조화된 오케스트레이션을 위한 React TypeScript 프런트엔드를 갖춘 MCP 스타일 인터페이스로 프레임워크를 구현한다.
- 두 개의 작업 도메인(여행 계획 및 이야기 작성)에 걸쳐 Human Tool과 AI 도구 기준선을 비교하는 통제된 실험을 수행하고 표준화된 사용성, 작업 부하 측정 및 객관적 작업 결과를 사용한다.

실험 결과
연구 질문
- RQ1RQ1: Human Tool이 AI 도구 기준선에 비해 작업 성능을 향상시키고 작업 부하를 줄이는가?
- RQ2RQ2: 프레임워크가 다른 작업 유형(계획 수립 vs 창의적 작업)에 걸쳐 적응 가능한가?
- RQ3RQ3: Human Tool이 인간–AI 상호작용에서 참여도와 협업 역학을 향상시키는가?
주요 결과
- Human Tool은 두 작업에서 AI 도구 기준선보다 우수한 성능을 보였으며 작업 정확도도 더 높았음(여행 계획: 86.72% 대 72.66%; 이야기 작성: 68.38 대 58.56) 및 승자 비율이 더 높음(이야기 작성: 0.611 대 0.371).
- 참가자들은 Human Tool 하에서 인지 부하가 감소하고 협업 만족도가 높아졌으며 CSI 평균이 75.48 대 52.83이고 이야기 작성에서 정신적 노력의 유의미한 감소를 보임.
- 두 작업 모두에서 민감도 지표(SUS)가 Human Tool에서 더 높았음(여행 계획: 70.89 대 58.22; 이야기 작성: 79.79 대 60.21).
- 의사결정 결정적 지점에서 인간 입력이 요청되어 입력의 관련성과 시기를 개선하는 호출 로그가 나타났음(선호도, 책임 경계, 지식 식별).
- 정성적 인터뷰에서 참가자들은 시스템을 파트너로 보았으며 더 깊은 공동 탐색과 아이디어의 원활한 공동 개발이 가능하다고 응답.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.