[论文解读] Central Similarity Hashing via Hadamard matrix.
该论文提出基于Hadamard矩阵的中心相似性哈希,引入一种新颖的全局相似性度量,促使相似数据对在汉明空间中聚集于共享哈希中心,而相异数据对则相互远离。通过利用Hadamard矩阵高效构建高质量的哈希中心,所提出的哈希中心网络(HCN)实现了最先进性能,在图像和视频检索任务中相较现有方法将平均平均精度(MAP)提升了4%–13%。
Hashing has been widely used for efficient large-scale multimedia data retrieval. Most existing methods learn hashing functions from data pairwise similarity to generate binary hash codes. However, in practice we find only learning from the local relationships of pairwise similarity cannot capture the global distribution of large-scale data, which would degrade the discriminability of the generated hash codes and harm the retrieval performance. To overcome this limitation, we propose a new global similarity metric, termed as \emph{central similarity}, to learn better hashing functions. The target of central similarity learning is to encourage hash codes for similar data pairs to be close to a common center and those for dissimilar pairs to converge to different centers in the Hamming space, which substantially improves retrieval accuracy. In order to principally formulate the central similarity learning, we define a new concept, \emph{hash center}, to be a set of points scattered in the Hamming space with a sufficient distance between each other, and propose to use Hadamard matrix to construct high-quality hash centers efficiently. Based on these definitions and designs, we devise a new hash center network (HCN) that learns hashing functions by optimizing the central similarity w.r.t. these hash centers. The central similarity learning and HCN are generic and can be applied for both image and video hashing. Extensive experiments for both image and video retrieval demonstrate HCN can generate cohesive hash codes for similar data pairs and dispersed hash codes for dissimilar pairs, and achieve noticeable boost in retrieval performance, i.e. 4\%-13\% in MAP over latest state-of-the-arts. The codes are in: \url{https://github.com/yuanli2333/Hadamard-Matrix-for-hashing}
研究动机与目标
- 解决现有哈希方法仅依赖局部成对相似性所带来的局限,此类方法无法捕捉全局数据分布。
- 通过引入新的相似性度量建模全局结构,提升学习到的二值哈希码的判别能力。
- 提出一种高效且可扩展的方法,用于在汉明空间中构建高质量哈希中心,以提升检索性能。
- 设计一个通用框架,适用于图像和视频检索任务,通过优化相对于这些哈希中心的中心相似性来实现性能提升。
提出的方法
- 定义一种名为中心相似性的新型全局相似性度量,使相似数据对在汉明空间中被鼓励靠近同一哈希中心。
- 引入“哈希中心”概念,即汉明空间中一组分离良好的点,作为聚类相似项的参考点。
- 利用Hadamard矩阵高效生成具有最大中心间距离的哈希中心,确保高质量且结构化的分布。
- 提出哈希中心网络(HCN),一种深度学习框架,联合学习哈希函数并针对所构建的哈希中心优化中心相似性损失。
- 将中心相似性学习目标表述为对比损失,使相似对被拉向同一中心,而相异对则被推离彼此的中心。
- 将基于Hadamard的哈希中心构建集成到训练流程中,确保在大规模检索任务中具备可扩展性和高效性。
实验结果
研究问题
- RQ1通过共享哈希中心建模全局数据分布,是否能提升学习到的二值哈希码的判别能力?
- RQ2与传统成对相似性相比,强制围绕共同中心聚类的中心相似性在检索准确率方面表现如何?
- RQ3Hadamard矩阵能否被有效利用以生成高质量、分离良好的哈希中心,从而提升哈希性能?
- RQ4在相同评估协议下,所提出的HCN框架在图像和视频检索任务中相较于最先进方法的性能提升程度如何?
- RQ5中心相似性学习框架是否具有通用性,并在不同多媒体检索任务中均表现有效?
主要发现
- 所提出的HCN框架在图像和视频检索任务中相较最新最先进方法,实现了4%–13%的平均平均精度(MAP)提升。
- HCN生成的哈希码表现出更强的相似数据对内聚性以及更强的相异对分散性,表明判别能力得到提升。
- Hadamard矩阵的使用实现了高效且可扩展的高质量哈希中心构建,且在汉明空间中实现了最大中心间距离。
- 中心相似性学习显著提升了检索性能,通过捕捉超越局部成对关系的全局数据结构。
- HCN框架在图像和视频检索任务中均表现出通用性和有效性,在多种设置下均实现一致性能增益。
- 消融实验确认,中心相似性损失和哈希中心构建是性能提升的关键组件。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。