Skip to main content
QUICK REVIEW

[论文解读] Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and Self-Control Gradient Estimator

Siamak Zamani Dadaneh, Shahin Boluki|arXiv (Cornell University)|May 21, 2020
Advanced Image and Video Retrieval Techniques参考文献 13被引用 2
一句话总结

该论文提出了一种新颖的成对监督哈希框架,采用伯努利变分自编码器(Bernoulli variational auto-encoder)并结合无偏、低方差梯度估计器,以优化二值哈希码。通过直接优化不可微的成对损失函数,该方法强制实现类内相似性和类间差异性,从而在文本数据上实现了最先进的检索精度。

ABSTRACT

Semantic hashing has become a crucial component of fast similarity search in many large-scale information retrieval systems, in particular, for text data. Variational auto-encoders (VAEs) with binary latent variables as hashing codes provide state-of-the-art performance in terms of precision for document retrieval. We propose a pairwise loss function with discrete latent VAE to reward within-class similarity and between-class dissimilarity for supervised hashing. Instead of solving the optimization relying on existing biased gradient estimators, an unbiased low-variance gradient estimator is adopted to optimize the hashing function by evaluating the non-differentiable loss function over two correlated sets of binary hashing codes to control the variance of gradient estimates. This new semantic hashing framework achieves superior performance compared to the state-of-the-arts, as demonstrated by our comprehensive experiments.

研究动机与目标

  • 通过利用监督成对约束,提升大规模文本检索中的语义哈希性能。
  • 解决在无偏且低方差梯度估计下优化不可微离散哈希码的挑战。
  • 用更精确的替代方法替换离散 VAE 中有偏的梯度估计器,以更好地优化哈希函数。
  • 通过定制的成对损失函数,增强学习到的二值码中的类内相似性和类间差异性。

提出的方法

  • 使用具有伯努利分布潜在变量的变分自编码器,以生成二值哈希码。
  • 引入一种成对损失函数,明确鼓励相同类别样本具有相似码字,不同类别样本具有相异码字。
  • 利用自控梯度估计器,为不可微的二值码计算无偏且低方差的梯度。
  • 通过采样两组相关的二值码来评估梯度,从而降低优化过程中的方差。
  • 通过可微的 VAE 组件端到端优化哈希函数,同时保持离散码字输出。

实验结果

研究问题

  • RQ1使用具有离散潜在变量的成对损失函数是否能提升文本检索中的监督哈希性能?
  • RQ2无偏梯度估计器与有偏估计器相比,在优化离散哈希码时表现如何?
  • RQ3自控梯度估计器在训练离散 VAE 用于哈希时,能在多大程度上降低方差?
  • RQ4所提出的框架在检索精度方面是否优于现有最先进方法?

主要发现

  • 所提方法在文本检索基准测试中,相较于最先进方法,实现了更优的检索精度。
  • 使用无偏、低方差梯度估计器,使离散哈希码的优化更加稳定且高效。
  • 成对损失函数有效增强了学习到的二值码中的类内相似性和类间差异性。
  • 该框架在精度指标方面,相较于现有基于 VAE 的哈希方法表现出更优的性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。