Skip to main content
QUICK REVIEW

[论文解读] Applying the Wizard-of-Oz Technique to Multimodal Human-Robot Dialogue

Matthew Marge, Claire Bonial|arXiv (Cornell University)|Mar 10, 2017
Social Robot Interaction and HRI参考文献 3被引用 26
一句话总结

本文將Wizard-of-Oz(WOz)方法應用於多模態人機對話的協作探索任務中,使用兩位巫師分別模擬機器人導航與對話管理。研究顯示,將巫師角色分工是可行且有效的,可用於收集自然的人機互動資料,支援未來更直覺的機器人通訊系統發展。

ABSTRACT

Our overall program objective is to provide more natural ways for soldiers to interact and communicate with robots, much like how soldiers communicate with other soldiers today. We describe how the Wizard-of-Oz (WOz) method can be applied to multimodal human-robot dialogue in a collaborative exploration task. While the WOz method can help design robot behaviors, traditional approaches place the burden of decisions on a single wizard. In this work, we consider two wizards to stand in for robot navigation and dialogue management software components. The scenario used to elicit data is one in which a human-robot team is tasked with exploring an unknown environment: a human gives verbal instructions from a remote location and the robot follows them, clarifying possible misunderstandings as needed via dialogue. We found the division of labor between wizards to be workable, which holds promise for future software development.

研究动机与目标

  • 開發更自然的人機互動方法,以模擬軍事情境下人與人之間的溝通方式。
  • 探討在多模態人機對話情境中使用Wizard-of-Oz方法的可行性。
  • 評估模擬機器人導航與對話管理組件的雙巫師設定。
  • 收集高品質、自然的互動資料,以訓練與評估人機對話系統。
  • 支援開發能即時理解並回應口頭指令的機器人系統,以適應協作任務中的實時互動。

提出的方法

  • 採用雙巫師設定,其中一位巫師負責控制機器人導航,另一位負責管理對話回應。
  • 參與者在遠端位置與機器人互動,執行模擬探索任務,並發出口頭指令。
  • 機器人以口頭方式回應,用以釐清指令或報告狀態,模擬即時對話。
  • 情境涉及探索未知環境,需協調口頭指令與機器人行動。
  • 資料於2016年IEEE RO-MAN會議期間的現場會議中收集,採用受控的互動設定。
  • WOz架構使研究人員能在未完全實現自主功能的情況下,模擬複雜的機器人行為。

实验结果

研究问题

  • RQ1雙巫師設定能否有效模擬人機互動中導航與對話管理的整合?
  • RQ2在協作探索任務中,使用WOz方法的人機互動在自然度與有效性方面如何?
  • RQ3在多模態對話系統中,將巫師職責分工作導航與對話,其挑戰與優勢為何?
  • RQ4WOz方法在多大程度上支援收集真實且可用的互動資料,以用於機器人訓練?
  • RQ5當口頭與導航行為均由人類巫師模擬時,使用者如何感知並適應機器人的回應?

主要发现

  • 將兩位巫師分別負責導航與對話的分工方式,被證明在模擬真實人機互動方面具備可行性與有效性。
  • 參與者成功透過口頭指令完成探索任務,機器人亦依需求提供釐清回應。
  • WOz設定使研究人員能在受控環境下收集自然的多模態互動資料。
  • 雙巫師方法在全自動化之前,對於原型設計與複雜機器人行為的評估具備可行性。
  • 該方法有助於識別人機對話中的關鍵互動模式與失敗情境。
  • 本研究確認,WOz技術仍是發展多模態人機對話系統的可行且具價值的方法。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。