Skip to main content
QUICK REVIEW

[论文解读] Tensor Factorization via Matrix Factorization

Volodymyr Kuleshov, Arun Tejasvi Chaganty|arXiv (Cornell University)|Jan 29, 2015
Tensor decomposition and applications参考文献 28被引用 45
一句话总结

该论文提出了一种新颖的张量分解方法,通过随机投影将CP张量分解转化为矩阵分解,从而能够使用稳定且优化的矩阵算法。通过将张量投影到O(log k)个随机向量上,该方法避免了特征值间隙敏感性,并在合成数据集和真实世界数据集上实现了最先进水平的准确性,包括在社区检测任务中实现15%的误差降低和在众包任务中实现8%的误差降低。

ABSTRACT

Tensor factorization arises in many machine learning applications, such knowledge base modeling and parameter estimation in latent variable models. However, numerical methods for tensor factorization have not reached the level of maturity of matrix factorization methods. In this paper, we propose a new method for CP tensor factorization that uses random projections to reduce the problem to simultaneous matrix diagonalization. Our method is conceptually simple and also applies to non-orthogonal and asymmetric tensors of arbitrary order. We prove that a small number random projections essentially preserves the spectral information in the tensor, allowing us to remove the dependence on the eigengap that plagued earlier tensor-to-matrix reductions. Experimentally, our method outperforms existing tensor factorization methods on both simulated data and two real datasets.

研究动机与目标

  • 解决张量分解领域缺乏成熟数值方法的问题,相较于矩阵分解而言。
  • 消除张量到矩阵降维方法中对特征值间隙的依赖,该依赖曾限制其对噪声的鲁棒性。
  • 使成熟的、数值稳定的矩阵分解算法能够被应用于张量问题。
  • 提供与现有方法相当的理论误差保证,且独立于所使用的联合对角化算法。
  • 在合成数据集和真实数据集上,实证证明该方法优于交替最小二乘法(ALS)和张量幂方法。

提出的方法

  • 该方法将一个三阶张量投影到O(log k)个随机向量上,生成一组矩阵。
  • 对投影后的矩阵执行同时矩阵对角化,以估计张量的秩-k因子。
  • 该方法适用于任意阶次的正交、非正交及非对称张量。
  • 随机投影保留了谱信息,使该方法能够避免对特征值间隙的依赖。
  • 可选的精炼步骤使用估计出的因子替代随机向量进行投影步骤。
  • 理论分析表明,误差界与噪声ε成比例,且独立于所使用的联合对角化算法。

实验结果

研究问题

  • RQ1张量分解能否在保持统计准确性的前提下,有效转化为矩阵分解?
  • RQ2随机投影是否消除了先前张量到矩阵降维方法中困扰特征值间隙依赖的问题?
  • RQ3能否利用成熟的矩阵分解算法来提升张量问题上的性能?
  • RQ4与现有的张量分解技术(如ALS和张量幂方法)相比,该方法在实际应用中的表现如何?
  • RQ5该方法的理论误差界如何随噪声和张量秩变化而变化?

主要发现

  • 与近期方法相比,该方法在社区检测任务中实现了高达15%的误差降低。
  • 在众包数据集上,误差降低最高达8%,在四个数据集中的三个上达到或超越了最先进的基于EM的估计器性能。
  • 理论保证表明,误差界与噪声ε成比例,且独立于所使用的联合对角化算法。
  • 通过O(log k)的随机投影,该方法避免了对特征值间隙的依赖,解决了先前基于矩阵的张量分解方法的关键局限。
  • 与EM等方法不同,局部最优解并非实际问题,这是由于联合对角化子程序具有有利的收敛特性。
  • 实证结果证实,利用优化的矩阵分解算法可同时提升准确性和速度。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。