Skip to main content
QUICK REVIEW

[論文レビュー] Rasa: Open Source Language Understanding and Dialogue Management

Tom Bocklisch, Joey Faulkner|arXiv (Cornell University)|Dec 14, 2017
Topic Modeling参考文献 14被引用数 139
ひとこと要約

Rasa は、分離されたコンポーネントと機械学習を用いた教育ワークフローを特徴とし、非専門の開発者向けに設計された言語理解と対話管理のオープンソースPythonツール NLU と Core を導入します。

ABSTRACT

We introduce a pair of tools, Rasa NLU and Rasa Core, which are open source python libraries for building conversational software. Their purpose is to make machine-learning based dialogue management and language understanding accessible to non-specialist software developers. In terms of design philosophy, we aim for ease of use, and bootstrapping from minimal (or no) initial training data. Both packages are extensively documented and ship with a comprehensive suite of tests. The code is available at https://github.com/RasaHQ/

研究の動機と目的

  • 機械学習ベースの対話管理と言語理解を、非専門の開発者でも利用できるようにする。
  • 最小限の初期トレーニングデータまたはデータなしで対話システムを構築する。
  • 言語間での再利用と簡易なデプロイをサポートする、モジュール式でデカップルドなアーキテクチャを提供する。
  • 包括的なドキュメント、テスト、および本番運用対応のデプロイワークフローを提供する。

提案手法

  • 会話状態を追跡するトラッカーと、次のアクションを選択するポリシーを備えたモジュール式アーキテクチャ。
  • トークン化/POS に spaCy、GloVe 埋め込み、scikit-learn分類器を組み合わせた NLU パイプライン。エンティティにはオプションの CRF。
  • スワップイン可能なコンポーネントと設定可能なバックエンドを備えた事前定義パイプライン(例: spacy_sklearn)。
  • トレーニングデータ形式: NLU は intents/entities を JSON/Markdown、対話のストーリーは Markdown。
  • システムのアクションを反復的に修正し、トレーニングデータを拡張する機械教育ワークフロー。
  • トレーニングデータとポリシーの挙動を解釈する対話グラフの可視化。
  • 再現性のある本番環境のための Docker ベースデプロイメント。

実験結果

リサーチクエスチョン

  • RQ1Rasa NLU と Core を独立して柔軟に使用しつつ、相互運用性を効果的に保てるか。
  • RQ2最小限または段階的なトレーニングデータでの性能はどうか、非線形な会話をどのように処理するか。
  • RQ3実務での対話ポリシー改善における機械教育の有効性は。
  • RQ4環境間での本番デプロイをどのように合理化し、再現性を確保するか。

主な発見

  • アーキテクチャは完全にデカップルドで、訓練済みモデルを言語を跨いで再利用しやすく、スムーズな本番デプロイを実現する。
  • Rasa NLU は spaCy、GloVe、マルチクラス分類器を用いた堅牢なパイプラインを使用し、エンティティは CRF コンポーネントで検出される。
  • Rasa Core は事前定義されたアクション上の分類問題として対話管理を扱い、特徴量ベースのポリシーを用いる。
  • max_history パラメータ(デフォルトは通常 3–6)が、シーケンスモデルの対話状態の特徴量化を形成する。
  • 機械教育は、予測されたアクションを修正し、ポリシーを部分的にトレーニングすることでトレーニングデータを生成する実用的なワークフローを提供する。
  • ストーリーグラフの可視化は、トレーニングデータとポリシーの決定の解釈とデバッグを支援する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。