Skip to main content
QUICK REVIEW

[论文解读] A family of statistical symmetric divergences based on Jensen's inequality

Frank Nielsen|arXiv (Cornell University)|Sep 21, 2010
Statistical Mechanics and Entropy参考文献 16被引用 61
一句话总结

本文基于Jensen不等式,提出了一类参数化的对称统计散度——对称α-偏斜Jensen散度——统一了Jeffreys散度与Jensen-Shannon散度。该方法通过参数α实现这两种散度之间的平滑插值,采用通用算法计算唯一中心点,在Caltech 101图像数据集上,α = 1/4时分类性能得到提升。

ABSTRACT

We introduce a novel parametric family of symmetric information-theoretic distances based on Jensen's inequality for a convex functional generator. In particular, this family unifies the celebrated Jeffreys divergence with the Jensen-Shannon divergence when the Shannon entropy generator is chosen. We then design a generic algorithm to compute the unique centroid defined as the minimum average divergence. This yields a smooth family of centroids linking the Jeffreys to the Jensen-Shannon centroid. Finally, we report on our experimental results.

研究动机与目标

  • 通过在Jensen不等式中应用,将Jeffreys散度与Jensen-Shannon散度统一为一个连续的对称散度族。
  • 开发一种通用算法,用于计算在该散度族下最小化平均散度的唯一中心点。
  • 实现基于数据的最优α参数选择,以应用于信息检索与聚类任务。
  • 证明对于指数族分布,中心点计算可简化为自然参数上的对称α-Jensen散度,从而实现闭式解。
  • 通过二值图像分类任务的实证验证,评估α参数化散度的性能表现。

提出的方法

  • 提出一个参数化的对称散度族,即对称α-偏斜Jensen散度,其来源于对凸生成函数应用Jensen不等式。
  • 将散度定义为两个偏斜K散度的平均值:$\mathrm{JS}_\alpha(p,q) = \frac{1}{2}(K_\alpha(p:q) + K_\alpha(q:p))$,其中 $K_\alpha(p:q) = \int p(x)\log\frac{p(x)}{(1-\alpha)p(x) + \alpha q(x)}dx$。
  • 引入一种迭代定点算法,用于计算使对集合中所有分布的平均散度最小的中心点,利用凸优化与凹-凸规划方法。
  • 证明对于指数族分布,密度上的对称α-Bhattacharyya散度可简化为自然参数上的对称α-Jensen散度,从而实现闭式中心点计算。
  • 在Caltech 101数据集的直方图特征上,采用带α参数化的散度与最近邻规则,评估不同α值下的分类性能。
  • 通过调优α以优化分类准确率,结果表明性能随α变化,且对数据几何结构敏感。

实验结果

研究问题

  • RQ1能否构建一个连续的对称散度族,统一Jeffreys散度与Jensen-Shannon散度?
  • RQ2在该新散度族下,如何高效且唯一地计算一组概率分布的中心点?
  • RQ3在实际应用(如分类)中,对称α-偏斜Jensen散度中的α选择是否显著影响性能?
  • RQ4在该散度框架下,是否可对同属一个指数族的分布实现中心点的闭式计算?
  • RQ5是否存在一个最优α值,可使真实世界数据(如图像直方图)的分类误差最小化?

主要发现

  • 所提出的对称α-偏斜Jensen散度族在Jeffreys散度(α = 1)与Jensen-Shannon散度(α = 1/2)之间实现平滑插值,且在测试的分类任务中,α = 1/4时性能最佳。
  • 对于同属一个指数族的分布,对称α-Bhattacharyya散度下的中心点,等价于其自然参数在对称α-Jensen散度下的中心点,从而实现闭式解。
  • 中心点唯一,且可通过定点迭代算法计算,确保在Ali-Silvey-Csiszár类凸散度中收敛。
  • 在Caltech 101上的实证结果表明,分类准确率随α变化,α = 1/4时达到约88%的最高正确率。
  • α = 1/4的配置所对应的散度介于Jeffreys与Jensen-Shannon散度之间,表明其具有更高的鲁棒性,并更契合底层数据几何结构。
  • 对称α-偏斜Jensen散度的平方根构成一个度量,满足三角不等式,支持其在基于度量的学习与聚类中的应用。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。