[논문 리뷰] Structured Exploration vs. Generative Flexibility: A Field Study Comparing Bandit and LLM Architectures for Personalised Health Behaviour Interventions
본 연구는 4주간 현장 연구(N=54)에서 맥락적 밴딧과 LLM을 결합한 다섯 가지 일일 메시징 접근법을 비교하여 personalised health behaviour interventions를 다루며, LLM이 템플릿을 능가하고 밴딧 최적화는 추가로 인지된 이점을 제공하지 못했다.
Behaviour Change Techniques (BCTs) are central to digital health interventions, yet selecting and delivering effective techniques remains challenging. Contextual bandits enable statistically grounded optimisation of BCT selection, while Large Language Models (LLMs) offer flexible, context-sensitive message generation. We conducted a 4-week study on physical activity motivation (N=54; 9 post-study interviews) that compared five daily messaging approaches: random templates, contextual bandit with templates, LLM generation, hybrid bandit+LLM, and LLM with interaction history. LLM-based approaches were rated substantially more helpful than templates, but no significant differences emerged among LLM conditions. Unexpectedly, bandit optimisation for BCTs selection yielded no additional perceived helpfulness compared with LLM-only approaches. Unconstrained LLMs focused heavily on a single BCT, whereas bandit systems enforced systematic exploration-exploitation across techniques. Quantitative and qualitative findings suggest contextual acknowledgement of user input drove perceived helpfulness. We contribute design suggestions for reflective AI health behaviour change systems that address a trade-off between structured exploration and generative autonomy.
연구 동기 및 목표
- 디지털 건강 개입에서 BCT가 어떻게 선택되고 전달되는지 동기를 제시한다.
- 맥락적 밴딧이 LLM 기반 메시징보다 BCT 선택을 개선하는지 조사한다.
- 건강 메시징에서 구조화된 탐색과 생성적 유연성 간의 트레이드오프를 검토한다.
- 실세계 환경에서 서로 다른 메시징 접근법의 사용자 인지 도움 느낌을 평가한다.
제안 방법
- 54명의 참가자를 대상으로 4주간 현장 연구를 수행하여 다섯 가지 일일 메시징 접근법을 평가한다.
- 무작위 템플릿, 템플릿이 있는 맥락적 밴딧, LLM 생성, 하이브리드 밴딧+LLM, 상호작용 이력을 가진 LLM을 비교한다.
- 인지된 도움뿐만 아니라 동기 부여 결과를 측정하고, 연구 종료 후 인터뷰(N=9)를 보완한다.
- 인지된 효과성에 영향을 주는 요인을 식별하기 위해 정성적 피드백을 분석한다.
- 제한 없이 자유로운 LLM 초점과 기술 전반에 걸친 밴딧이 강제하는 탐색-활용을 대비한다.
실험 결과
연구 질문
- RQ1LLM 기반 메시징 접근법이 무작위 템플릿 및 밴딧 보조 방법에 비해 인지된 도움을 증가시키는가?
- RQ2BCT 선택을 위한 밴딧 최적화를 추가하는 것이 LLM만 접근법을 넘는 추가적인 인지적 이점을 가져오는가?
- RQ3사용자 입력 인정의 역할이 인지된 도움 및 동기에 어떤 영향을 미치는가?
- RQ4AI 건강 행동 변화 시스템 설계에서 구조화된 탐색과 생성적 유연성의 균형은 어떻게 이루어지는가?
주요 결과
- LLM 기반 접근법은 템플릿보다 상당히 더 도움으로 평가되었다.
- LLM 조건 간에 유의미한 차이가 나타나지 않았다.
- BCT 선택을 위한 밴딧 최적화는 LLM전용 접근법과 비교해 추가적인 인지된 도움을 제공하지 않았다.
- 제한 없는 LLM은 단일 BCT에 집중하는 경향이 있었고, 밴딧 시스템은 기술 전반에 걸친 체계적 탐색-활용을 강제했다.
- 사용자 입력에 대한 맥락적 인정이 인지된 도움에 기여했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.