QUICK REVIEW

[논문 리뷰] ViSTAR: Virtual Skill Training with Augmented Reality with 3D Avatars and LLM coaching agent

Chunggi Lee, Hayato Saiki|arXiv (Cornell University)|2026. 02. 25.

Action Observation and Synchronization인용 수 0

한 줄 요약

ViSTAR는 3D 아바타와 AI 코칭 에이전트를 활용하여 BST에 맞춘 지시, 모델링, 리허설 및 피드백을 제공하는 AR 기반 농구 기술 훈련 시스템이다.

ABSTRACT

We present ViSTAR, a Virtual Skill Training system in AR that supports self-guided basketball skill practice, with feedback on balance, posture, and timing. From a formative study with basketball players and coaches, the system addresses three challenges: understanding skills, identifying errors, and correcting mistakes. ViSTAR follows the Behavioral Skills Training (BST) framework-instruction, modeling, rehearsal, and feedback. It provides feedback through visual overlays, rhythm and timing cues, and an AI-powered coaching agent using 3D motion reconstruction. We generate verbal feedback by analyzing spatio-temporal joint data and mapping features to natural-language coaching cues via a Large Language Model (LLM). A key novelty is this feedback generation: motion features become concise coaching insights. In two studies (N=16), participants generally preferred our AI-generated feedback to coach feedback and reported that ViSTAR helped them notice posture and balance issues and refine movements beyond self-observation.

연구 동기 및 목표

AR 가이드를 통한 신체화된 농구 기술의 이해 및 수정의 장벽 해소.
AR에서 BST 정보를 반영한 교육 프레임워크(지시, 모델링, 리허설, 피드백) 제공.
LLM 기반 파이프라인을 통해 운동학 데이터를 구두 및 시각 코칭 신호로 변환.
실시간 시각 오버레이와 AI 코치로 자기주도 학습 가능하게 함.
파일럿 연구에서 AI 생성 피드백과 인간 코칭 피드백에 대한 사용자 인지 평가.

제안 방법

AR에서 지시, 모델링, 리허설 및 피드백을 포함한 BST를 활용한 방법.
참조 아바타를 애니메이션화하고 다각도 검사를 위한 오버레이를 제공하기 위해 3D 재구성 사용.
움직임 분석(포즈 추정, DTW, Random Forest)을 합성하여 시각 및 구두 피드백 생성.
시각 오버레이와 골격 신호를 통해 전반적(흐름/타이밍) 및 국소적(관절 수준) 지침 구현.
운동 특징을 연결하여 자연어 코칭 신호를 생성하는 LLM 기반 피드백 생성기를 사용.
두 개의 사용자 연구(N=16 총)에서 AI 생성 코칭을 평가.

실험 결과

연구 질문

RQ1AR 및 AI가 신체화된 농구 기술에 대해 효과적이고 코치와 같은 피드백을 어떻게 제공할 수 있는가?
RQ2자세와 움직임 교정을 위해 AI 생성 피드백이 코치 피드백보다 사용자에게 선호되는가?
RQ3BST- aligned AR 가이드가 학습자가 자세/균형 문제를 알아차리고 자기관찰을 넘어 움직임을 다듬게 도울 수 있는가?
RQ4AR에서 자기주도 학습을 지원하기 위한 효과적인 시각 및 구두 피드백 방식은 무엇인가?

주요 결과

참가자들이 기본 자세 오류 식별 및 구체적 수정에 대해 AI 생성 피드백을 선호했다.
AR 가이드가 자세 및 균형 문제를 알아차리고 자기관찰을 넘어 움직임을 개선하는 데 도움을 주었다.
두 개의 사용자 연구(N=16)에서 AI 피드백은 호응도 높고 몰입도가 있었으나 표본 크기가 성능 주장을 제약했다.
관절 수준의 운동 분석을 자연어 코칭 신호로 변환하는 것을 LLM을 통해 구현하는 가능성을 시연했다.
ViSTAR는 3D 아바타와 다면 피드백으로 BST에 맞춘 AR 코칭 프레임워크를 제공한다.
구두 피드백 생성을 DTW 정렬된 모션 디스크립터 및 Random Forest 피처 중요도를 사용하여 LLM에 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.