Skip to main content
QUICK REVIEW

[논문 리뷰] Rasa: Open Source Language Understanding and Dialogue Management

Tom Bocklisch, Joey Faulkner|arXiv (Cornell University)|2017. 12. 14.
Topic Modeling참고 문헌 14인용 수 139
한 줄 요약

Rasa는 비전문 개발자를 대상으로 해석 가능하고 대화 관리 기능을 제공하는 오픈 소스 Python 도구 NLU와 Core를 도입하며, 분리된 구성 요소와 머신 티칭 워크플로를 갖춘 설계이다.

ABSTRACT

We introduce a pair of tools, Rasa NLU and Rasa Core, which are open source python libraries for building conversational software. Their purpose is to make machine-learning based dialogue management and language understanding accessible to non-specialist software developers. In terms of design philosophy, we aim for ease of use, and bootstrapping from minimal (or no) initial training data. Both packages are extensively documented and ship with a comprehensive suite of tests. The code is available at https://github.com/RasaHQ/

연구 동기 및 목표

  • 머신 러닝 기반의 대화 관리 및 언어 이해를 비전문 개발자도 쉽게 접근 가능하게 한다.
  • 최소한의 초기 학습 데이터 또는 전혀 데이터가 없는 상태에서 대화 시스템을 구축한다.
  • 다양한 언어 간 재사용과 쉬운 배포를 지원하는 모듈식, 분리된 아키텍처를 제공한다.
  • 포괄적인 문서화, 테스트 및 프로덕션 준비 배포 워크플로를 제공한다.]
  • method

제안 방법

  • 대화 상태를 추적하는 트래커와 다음 행동을 선택하는 정책이 있는 모듈식 아키텍처를 사용한다.
  • 토큰화/POS를 위한 spaCy, GloVe 임베딩, sklearn 분류기를 결합한 NLU 파이프라인; 엔티티를 위한 선택적 CRF.
  • 바꿔넣기 가능한 구성 요소와 구성 가능한 백엔드를 제공하는 사전 정의된 파이프라인(예: spacy_sklearn).
  • 훈련 데이터 형식: NLU의 의도/엔티티는 JSON/Markdown; 대화의 이야기는 Markdown의 스토리로 구성.
  • 시스템 동작을 반복적으로 수정하고 학습 데이터를 확장하기 위한 머신 티칭 워크플로우.
  • 훈련 데이터를 해석하고 정책 동작을 이해하기 위한 대화 그래프 시각화.
  • 재현 가능한 프로덕션 환경 배포를 위한 Docker 기반 배포.

실험 결과

연구 질문

  • RQ1Rasa NLU와 Core를 독립적으로 유연하게 사용할 수 있으며 여전히 상호작용이 효과적인가?
  • RQ2최소 또는 점진적 학습 데이터로 시스템이 어떻게 작동하며 비선형 대화를 어떻게 처리하는가?
  • RQ3실제적으로 대화 정책을 향상시키는 머신 티칭의 효과는 무엇인가?
  • RQ4환경 간에 프로덕션 배포를 간소화하고 재현 가능하게 만드는 방법은 무엇인가?

주요 결과

  • 아키텍처가 완전히 분리되어 있어 학습된 모델의 언어 간 재사용과 간편한 프로덕션 배포가 가능하다.
  • Rasa NLU는 spaCy, GloVe, 다중 클래스 분류기로 견고한 파이프라인을 사용하고 엔티티는 CRF 구성요소로 감지된다.
  • Rasa Core는 기능 기반 정책을 사용하여 미리 정의된 행동에 대한 분류 문제로 대화 관리를 처리한다.
  • max_history 매개변수(기본값은 일반적으로 3–6)는 시퀀스 모델의 대화 상태 특성화에 영향을 준다.
  • 머신 티칭은 예측된 행동을 수정하고 부분적으로 정책을 학습시킴으로써 학습 데이터를 생성하는 실용적인 워크플로를 제공한다.
  • 스토리 그래프의 시각화는 학습 데이터 및 정책 결정의 해석과 디버깅에 도움을 준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.