[论文解读] Automatic Selection of t-SNE Perplexity
本文提出一种基于新颖目标函数的自动t-SNE困惑度超参数选择方法:$2\text{KL}(P||Q) + \log(n)\frac{\text{Perp}}{n}$,并通过人工专家偏好收集验证了该方法。该方法通过建模专家偏好并使用高斯过程,消除了手动调参的需要,其性能优于默认设置。
t-Distributed Stochastic Neighbor Embedding (t-SNE) is one of the most widely used dimensionality reduction methods for data visualization, but it has a perplexity hyperparameter that requires manual selection. In practice, proper tuning of t-SNE perplexity requires users to understand the inner working of the method as well as to have hands-on experience. We propose a model selection objective for t-SNE perplexity that requires negligible extra computation beyond that of the t-SNE itself. We empirically validate that the perplexity settings found by our approach are consistent with preferences elicited from human experts across a number of datasets. The similarities of our approach to Bayesian information criteria (BIC) and minimum description length (MDL) are also analyzed.
研究动机与目标
- 通过自动化选择消除对t-SNE困惑度的手动、依赖经验的调优。
- 开发一种反映专家对最优困惑度设置判断的模型选择目标函数。
- 通过人类专家的成对偏好收集验证所提出的目标函数。
- 证明该方法在包括数字、coil20和人脸在内的多样化数据集上具有泛化能力。
提出的方法
- 提出新的目标函数:$S(\text{Perp}) = 2\text{KL}(P||Q) + \log(n)\frac{\text{Perp}}{n}$,该函数基于信息论原理推导得出。
- 通过8位人类专家的成对偏好收集,获取关于良好困惑度设置的标注判断。
- 使用具有二元排序似然的高斯过程建模专家不确定性,以推断最优困惑度。
- 将高维与低维分布之间的KL散度作为目标函数的核心组成部分。
- 对目标函数进行校准,以在重建保真度与复杂度之间取得平衡,类似于BIC,但复杂度调节方向相反。
实验结果
研究问题
- RQ1是否能够通过数据驱动的目标函数可靠地选择t-SNE困惑度,而无需人工干预?
- RQ2所提出的目标函数与经专家验证的最优困惑度偏好匹配程度如何?
- RQ3该方法在具有不同数据结构的多样化数据集上是否具有泛化能力?
- RQ4为何目标函数$2\text{KL}(P||Q) + \log(n)\frac{\text{Perp}}{n}$优于标准KL最小化?
主要发现
- 所提出的目标函数$S(\text{Perp}) = 2\text{KL}(P||Q) + \log(n)\frac{\text{Perp}}{n}$在匹配专家偏好方面优于默认困惑度设置。
- 人类专家偏好数据在不同数据集上表现出一致的模式,验证了该方法的泛化能力。
- 该方法成功减少了在困惑度选择中对视觉检查和专家经验的依赖。
- 目标函数被发现能有效平衡模型拟合与复杂度,其结构类似于BIC,但复杂度调节方向相反。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。