QUICK REVIEW
[论文解读] Efficient Natural Language Response Suggestion for Smart Reply
Matthew Henderson, Rami Al‐Rfou|arXiv (Cornell University)|May 1, 2017
Topic Modeling参考文献 28被引用 220
一句话总结
论文提出一种使用 n-gram 嵌入和分层量化的快速前馈模型来对智能回复候选进行评分和排序,在质量上优于 Seq2Seq,同时计算成本和延迟大幅降低。
ABSTRACT
This paper presents a computationally efficient machine-learned method for natural language response suggestion. Feed-forward neural networks using n-gram embedding features encode messages into vectors which are optimized to give message-response pairs a high dot-product value. An optimized search finds response suggestions. The method is evaluated in a large-scale commercial e-mail application, Inbox by Gmail. Compared to a sequence-to-sequence approach, the new system achieves the same quality at a small fraction of the computational requirements and latency.
研究动机与目标
- 降低真实世界邮件应用中智能回复响应建议的计算成本和延迟。
- 探究用于建模输入与响应兼容性的前馈、非循环网络结构。
- 实现从固定的大规模候选响应集合中快速、可扩展的检索。
- 利用多种特征和偏置校正来提升回复质量。
- 在生产环境的 Gmail 收件箱智能回复场景中展示端到端的改进。
提出的方法
- 用通过求和 n-gram 嵌入形成的固定维特征来表示输入的邮箱和回复(n-gram 袋)。
- 训练神经打分模型,为输入 x 与候选 y 指派 S(x,y),具有联合和点积架构。
- 使用点积分解 S(x,y)=hx^T hy 以预计算响应向量并实现高效的 MIPS 风格搜索。
- 在一个批次中用多负样本进行训练以近似 P(y|x) 并优化负对数似然目标(Eq. 5)。
- 通过多损失架构融入多种邮件特征,以利用不同的输入信号改进评分。
- 通过语言模型为响应提供偏置项 α log PLM(y) 来鼓励泛用性回复。
- 采用分层量化(HQ)结合向量量化与乘积量化,并使用学习得到的旋转,以实现对响应的快速近似搜索。
实验结果
研究问题
- RQ1具备 n-gram 嵌入的前馈非循环模型能否在回复建议质量上达到甚至超过 Seq2Seq?
- RQ2在回复选择中的联合打分与点积打分架构之间的性能权衡是什么?
- RQ3多个特征与负采样策略如何影响排序准确性?
- RQ4分层量化在快速且高召回检索顶层回复方面的效果如何?
- RQ5在生产智能回复系统中可实现的在线性能提升(转化率、延迟)有哪些?
主要发现
| System/Experiment | Experiment | Conversion relative to Seq2Seq | Latency relative to Seq2Seq |
|---|---|---|---|
| 穷举搜索 | 使用联合模型对所有响应进行评分 | – | 500% |
| 两步法 | 先点积再联合打分 | 67% | 10% |
| 包含响应偏置 | 添加语言模型偏置项 | 88% | 10% |
| 改进采样与多损失 | 带有多损失的数据集改进 | 104% | 10% |
| 单步 | 在增强的点积模型下移除第二步 | 104% | 2% |
| 分层量化 | 使用 HQ 对响应进行快速搜索 | 104% | 1% |
- 点积(嵌入基)模型在训练更高效的同时,精度接近或优于联合模型。
- 在100个候选项的测试集上,P@1 对于联合模型为 49%,对点积模型分别为 48%(批次25)或 52%(批次50)。
- 在线系统迭代显示延迟显著降低,转化率相当或提高:两步法在相对 Seq2Seq 的延迟降低 10% 的情况下实现 67% 转化;单步法在增强负样本和多损失特征下相对 Seq2Seq 实现 104% 转化并仅 2% 延迟;分层量化进一步将速度翻倍且不损失质量。
- 通过语言模型为响应提供偏置可提升建议质量(表 3 第 3 行)。
- 使用更大批次的负样本和多损失架构的训练在在线实验中优于基线 Seq2Seq(第 4 行)。
- 最终单步系统使用点积打分与分层搜索,在计算量显著减少的同时实现相似或更好质量(第 5 行和第 6 行)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。