Skip to main content
QUICK REVIEW

[论文解读] StarSpace: Embed All The Things!

Ledell Wu, Adam Fisch|arXiv (Cornell University)|Sep 12, 2017
Topic Modeling参考文献 21被引用 92
一句话总结

StarSpace 是一种通用的神经嵌入模型,将离散特征实体嵌入并在共用空间中比较,用于标签化、排序、推荐和图嵌入任务。

ABSTRACT

We present StarSpace, a general-purpose neural embedding model that can solve a wide variety of problems: labeling tasks such as text classification, ranking tasks such as information retrieval/web search, collaborative filtering-based or content-based recommendation, embedding of multi-relational graphs, and learning word, sentence or document level embeddings. In each case the model works by embedding those entities comprised of discrete features and comparing them against each other -- learning similarities dependent on the task. Empirical results on a number of tasks show that StarSpace is highly competitive with existing methods, whilst also being generally applicable to new cases where those methods are not.

研究动机与目标

  • 开发一个通用嵌入模型,能够在不同领域处理标注、排序和嵌入任务。
  • 证明 StarSpace 在多项任务上与专门方法具有竞争力。
  • 展示对样本外实体的自然处理以及多类型比较。
  • 提供一个开源实现,以便广泛采用和实验。

提出的方法

  • 将每个实体表示为来自固定词典的离散特征的袋。
  • 将特征嵌入到共享的 d 维空间中,并通过对特征嵌入求和来形成实体嵌入。
  • 使用基于边距的损失结合负采样来区分正对与负对进行训练。
  • 在损失中将相似度函数(余弦相似度或内积)作为排序/分类的基础。
  • 在 CPU 上应用带 Adagrad 和 Hogwild 的随机梯度下降,以及对嵌入的最大范数约束。
  • 提供针对分类、推荐和知识图谱连接任务的正/负对生成器(E+, E−)。

实验结果

研究问题

  • RQ1单一嵌入框架是否能够有效地执行文本分类、文档/文档排序、协同/基于内容的过滤和知识图谱嵌入?
  • RQ2在多样化任务中,StarSpace 相对于任务特定基线(如 fastText、TransE、TFIDF、SVM)的表现如何?
  • RQ3通过将用户/项目/标签特征化为特征袋,模型是否能自然处理样本外实体?
  • RQ4负样本数量(k)对性能和训练效率的影响是什么?

主要发现

  • StarSpace 在文本分类基准测试中与 fastText 相竞争,在文档推荐任务中表现出色。
  • 在 Freebase 15k 上,StarSpace 在链接预测方面与 TransE 相当,嵌入维度也相当。
  • 在维基百科搜索和句子匹配中,StarSpace 通过直接针对任务(句子/文档级别)进行训练,超越了若干基线。
  • StarSpace 通过基于特征的表示而不是固定ID为用户/项目提供样本外扩展。
  • 增加负样本参数 k 表现出训练速度与预测性能之间的权衡,在某些范围内在时间限制内达到最佳结果。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。