Skip to main content
QUICK REVIEW

[논문 리뷰] Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memory

Hao Zhou, Minlie Huang|arXiv (Cornell University)|2017. 04. 04.
Topic Modeling참고 문헌 45인용 수 116
한 줄 요약

ECM은 감정 범주 임베딩, 내부 감정 메모리, 외부 감정 어휘 메모리를 시퀀스-투-시퀀스 프레임워크에 통합함으로써 관련성과 문법성뿐 아니라 정서적으로 응집력 있는 오픈 도메인 응답을 생성한다.

ABSTRACT

Perception and expression of emotion are key factors to the success of dialogue systems or conversational agents. However, this problem has not been studied in large-scale conversation generation so far. In this paper, we propose Emotional Chatting Machine (ECM) that can generate appropriate responses not only in content (relevant and grammatical) but also in emotion (emotionally consistent). To the best of our knowledge, this is the first work that addresses the emotion factor in large-scale conversation generation. ECM addresses the factor using three new mechanisms that respectively (1) models the high-level abstraction of emotion expressions by embedding emotion categories, (2) captures the change of implicit internal emotion states, and (3) uses explicit emotion expressions with an external emotion vocabulary. Experiments show that the proposed model can generate responses appropriate not only in content but also in emotion.

연구 동기 및 목표

  • 대규모 대화 생성을 위한 감정 통합의 도전 과제를 다룬다.
  • 콘텐츠에 적합하고 감정 일관성을 가진 응답을 생성하는 엔드투엔드 신경망 모델을 개발한다.
  • 감정 표현을 제어하기 위해 감정 범주 임베딩, 내부 감정 메모리, 외부 감정 메모리의 세 가지 메커니즘을 도입한다.
  • 대규모 학습을 위해 자동으로 주석된 감정 라벨 데이터로 학습한다.
  • 감정 인식 생성이 콘텐츠 품질과 정서 정확도 모두를 향상시키는지 평가한다.

제안 방법

  • 포스트 X를 처리하고 감정 범주 e에 조건화된 응답 Y를 생성하기 위해 GRU를 갖춘 인코더-디코더 seq2seq를 확장한다.
  • 감정 범주 벡터 v_e를 임베딩하고 이를 컨텍스트 c_t 및 이전 단어 임베딩 e(y_{t-1})와 함께 디코더에 주입한다.
  • 디코딩 중 동적 감정 상태를 모델링하기 위해 읽기/쓰기 게이트가 있는 내부 메모리 M^I_e,t를 도입하고 생성 종료 시까지 0으로 감소하도록 한다.
  • 감정 단어 어휘가 분리된 외부 감정 메모리와 감정 대 일반 단어 생성을 가중하기 위한 타입 선택자 alpha_t를 추가하여 명시적 감정 표현을 가능하게 한다.
  • 토큰 예측의 교차 엔트로피 손실, 감정/일반 단어 선택에 대한 감독, 내부 감정 소실을 보장하는 정규화 항을 결합한 손실로 학습한다.
  • NLPCC 데이터를 사용해 감정 분류기를 학습시켜 대규모 STC 기반 말뭉치(ESTC)에 여섯 가지 감정 범주로 라벨링하고, 그런 뒤 (post, response, emotion) 트리플에 대해 ECM을 학습한다.

실험 결과

연구 질문

  • RQ1지정된 감정 범주를 주어도 신뢰할 수 있을 만큼 콘텐츠에 적합하고 정서적으로 일관된 응답을 신경망 인코더-디코더 프레임워크가 생성할 수 있는가?
  • RQ2감정 범주 임베딩, 내부 메모리, 외부 메모리가 기저 seq2seq 모델과 비교해 감정 정확도와 응답의 자연성을 향상시키는가?
  • RQ3제안된 메모리 모듈 및 감정 어휘의 선택적 제거가 퍼플렉시티와 감정 정확도에 어떤 영향을 미치는가?
  • RQ4외부 메모리를 통한 명시적 감정 단어 생성이 인지 가능한 정서 표현을 생성하는 데 이로운가?

주요 결과

  • ECM은 기본선 및 변형들보다 높은 감정 정확도(0.773)를 달성하여 정서 표현력이 향상되었음을 시사한다.
  • ECM은 퍼플렉시티(65.9)가 Seq2Seq보다 낫고 Emb 베이스라인보다 약간 낮아 콘텐츠와 감정 생성에 대한 감독을 반영한다.
  • 특히 외부 메모리가 감정 정확도를 가장 많이 향상시키고, 내부 메모리가 문법과 감정의 균형에 도움을 주며, 외부 메모리를 제거하면 감정 표현이 감소하는 것으로 나타났다.
  • 수동 평가에서 ECM은 Seq2Seq 및 Emb보다 콘텐츠 및 감정 점수가 더 높았고, 쌍대 비교 테스트에서 ECM에 대한 선호가 크게 나타났다.
  • ECM은 다양한 감정 카테고리에 조건화된 응답을 생성하는 능력을 보여주고, 명시적 감정 단어가 표현력을 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.