Skip to main content
QUICK REVIEW

[논문 리뷰] Zero-Resource Knowledge-Grounded Dialogue Generation

Linxiao Li, Can Xu|arXiv (Cornell University)|2020. 08. 29.
Topic Modeling참고 문헌 76인용 수 50
한 줄 요약

논문은 ZRKGC를 제로 리소스, 변분식 이중 잠재 잠금 모델로 제시하며, 검색 기반 잠재 지식과 grounding 비율을 사용해 외부 지식으로 대화를 근거화하고 crowd-sourced 지식-근거 훈련 없이도 경쟁적인 결과를 달성한다.

ABSTRACT

While neural conversation models have shown great potentials towards generating informative and engaging responses via introducing external knowledge, learning such a model often requires knowledge-grounded dialogues that are difficult to obtain. To overcome the data challenge and reduce the cost of building a knowledge-grounded dialogue system, we explore the problem under a zero-resource setting by assuming no context-knowledge-response triples are needed for training. To this end, we propose representing the knowledge that bridges a context and a response and the way that the knowledge is expressed as latent variables, and devise a variational approach that can effectively estimate a generation model from a dialogue corpus and a knowledge corpus that are independent with each other. Evaluation results on three benchmarks of knowledge-grounded dialogue generation indicate that our model can achieve comparable performance with state-of-the-art methods that rely on knowledge-grounded dialogues for training, and exhibits a good generalization ability over different topics and different datasets.

연구 동기 및 목표

  • 학습을 위한 컨텍스트-지식-응답 삼중항(triples) 없이도 지식-근거 대화를 촉진한다.
  • 맥락(context)과 응답을 연결하기 위한 이중 잠재 변수 프레임워크(잠재 지식 Zk 및 grounding 비율 Za)를 도입한다.
  • 효율적 학습을 가능하게 하는 Zk에 대한 검색 기반 후방 분포를 사용하는 변분 학습 접근법을 개발한다.
  • 지식 선택 및 상호 정보 손실을 포함시켜 grounding 표현력 및 안정성을 향상시킨다.
  • 세 가지 벤치마크에서 주제와 데이터셋 간의 일반화 성능을 입증한다.

제안 방법

  • 확률적 프레임워크에서 두 개의 잠재 변수 Zk(지식)와 Za(그라운딩 비율)로 p(R|C,K)를 형식화한다.
  • 관련성 모델로 검색된 상위 k 개의 지식 후보에서 선택하는 q(Zk|C,R)와 같은 검색 기반 포스터리어를 사용한다.
  • 백본 생성은 p(R|C,Zk,Za)를 모델링하기 위해 UNILM을 사용한다.
  • 모델 용량 하에서 입력 크기를 제약하기 위한 지식 선택 모델을 도입한다.
  • Za가 지식 표현을 포착하도록 장려하는 상호 정보 손실을 포함한다.
  • 일반화 EM(GE-M)으로 최적화하고(q와 함께 E-step, p와 함께 M-step) differentiable 토큰 샘플링을 위한 Gumbel-softmax를 사용한다.

실험 결과

연구 질문

  • RQ1제로 리소스 설정에서 컨텍스트-지식-응답 훈련 삼중항 없이도 지식-근거 대화를 학습할 수 있는가?
  • RQ2지식 그라운딩과 그라운딩 비율의 이중 잠재 변수 모델이 생성 품질과 지식 활용 제어에 도움이 되는가?
  • RQ3이 작업에서 검색 기반 포스터리어 학습은 완전 생성 포스터리어와 비교하여 얼마나 잘 수행되는가?
  • RQ4지식 선택과 상호 정보 손실이 성능 및 grounding 제어 가능성에 어떤 영향을 미치는가?
  • RQ5ZRKGC가 주제 및 데이터셋 간 일반화 능력이 최신 방법과 비교해 어떠한가?

주요 결과

모델Wizard Seen PPLWizard Seen F1Wizard Unseen PPLWizard Unseen F1Topical Freq PPLTopical F1Topical Rare PPLTopical Rare F1CMU_DoG PPLCMU_DoG F1
MTASK-RF65.413.167.712.351.312.651.612.567.210.5
TMN66.515.9103.614.330.316.552.114.675.29.9
ITDD17.816.244.811.421.415.824.714.026.010.4
SKT52.019.381.416.125.117.035.614.841.99.6
DRD19.419.323.017.925.914.828.015.154.410.7
ZRKGC40.418.741.518.644.216.642.016.853.512.5
  • ZRKGC는 Wizard Seen, Wizard Unseen, Topical-Freq, Topical-Rare, 및 CMU_DoG 벤치마크에서 경쟁력 있는 F1 점수를 달성하며, 여러 베이스라인과 비교해 우수하거나 동등한 성능을 보인다.
  • ZRKGC는_seen 주제와 unseen 주제 간의 성능 저하가 작아 강력한 일반화 성능을 보인다.
  • 검색-포스터리어 학습은 ablations에서 생성 포스터리어 변형보다 더 타이트한 ELBO와 더 나은 F1를 제공한다.
  • 지식 선택 및 상호 정보 손실은 grounding 표현의 제어력과 안정성에 기여한다.
  • 사람 판단에서 ZRKGC가 경쟁적 베 baseline보다 더 유창하고 일관된 응답을 생성하는 것으로 나타났으나, 지식 통합은 여전히 도전적이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.