QUICK REVIEW

[论文解读] Similarity-Sensitive Entropy: Induced Kernels and Data-Processing Inequalities

Joseph Samuel Miller|arXiv (Cornell University)|Jan 6, 2026

Statistical Mechanics and Entropy被引用 0

一句话总结

本论文在核化概率空间中定义并分析一个对相似性敏感的熵 H_K，通过法则诱导的诱发核建立数据处理不等式，并在一般（非分区）核下探索条件信息和互信息的类比。

ABSTRACT

We study an entropy functional $H_K$ that is sensitive to a prescribed similarity structure on a state space. For finite spaces, $H_K$ coincides with the order-1 similarity-sensitive entropy of Leinster and Cobbold. We work in the general measure-theoretic setting of kernelled probability spaces $(Ω,μ,K)$ introduced by Leinster and Roff, and develop basic structural properties of $H_K$. Our main results concern the behavior of $H_K$ under coarse-graining. For a measurable map $f:Ω o Y$ and input law $μ$, we define a law-induced kernel on $Y$ whose pullback minimally dominates $K$, and show that it yields a coarse-graining inequality and a data-processing inequality for $H_K$, for both deterministic maps and general Markov kernels. We also introduce conditional similarity-sensitive entropy and an associated mutual information, and compare their behavior to the classical Shannon case.

研究动机与目标

激励并形式化一个尊重状态空间上预设相似性结构的熵泛函 H_K。
为核化概率空间建立测度理论框架，以及保持 H_K 的统一表示。
刻画 H_K 在可测映射与粗粒化下的行为，在该设定中建立数据处理不等式。
在 H_K 框架内引入以 X 为中心的条件熵和互信息。
区分分区（块对角）核与一般模糊核，并研究相关的不等式与不变量。

提出的方法

定义 H_K(p) = - sum_x p_x log((Kp)_x) 对于具有相似性矩阵 K 的离散 X。
将其扩展到核化概率空间 (Ω, μ, K)，使用典型性函数 τ(ω) = ∫ K(ω, ω′) dμ(ω′)，并得到 H_K(μ) = - ∫ log τ(ω) dμ(ω)。
展示在保持 H_K 的统一表示的情况下的统一表示，并证明在典型性的温和正性条件下，H_K 作为有限均匀分布熵的极限出现。
通过逐纤维的本质上确界构造法则诱导核 K^{Y,μ}，并回组合得到 K^{f,μ}，以建立数据处理不等式 H_K(μ) ≥ H_{K^{f,μ}}(μ) = H_{K^{Y,μ}}(f_#μ)。
提供提升性论证，将确定性 DPI 拓展到马尔可夫核，并证明诱导核的极小性性质。
定义以 X 为中心的条件熵 H_K(X|Y) 与互信息 I_K(X;Y)，并分析它们在分区核与非分区核下的行为差异。

实验结果

研究问题

RQ1如何定义并表示对状态空间预设相似性结构敏感的熵泛函？
RQ2相似性敏感熵在可测映射与粗粒化下的行为如何，是否可以在此设定中建立数据处理不等式？
RQ3在 H_K 框架下，条件信息与互信息的类比是什么，与香农理论在模糊核中的差异如何？
RQ4是否可以利用典型性分布来区分分区核与真正的模糊核，哪些不变量会出现？
RQ5在表示学习与实验设计中，相似性敏感信息量的任务驱动应用有哪些潜在方向？

主要发现

H_K(μ) 在核化概率空间上定义良好，可以在 ([0,1], λ) 上以统一表示表示，同时保持其数值。
给定一个可测映射 f，存在目标上的法则诱导核 K^{Y,μ}，以及源上的回组合核 K^{f,μ}，得到数据处理不等式 H_K(μ) ≥ H_{K^{f,μ}}(μ) = H_{K^{Y,μ}}(f_#μ)。
对于确定性映射，纤维最大构造给出一个规范诱导核，在所有输入下满足 DPI 的点对点最小性。
对于一般模糊核，H_K(X|Y) 不一定满足 H_K(X|Y) ≤ H_K(X)；提供了一个有限的反例，与分区核（块对角）情形中通常的条件不等式形成对比。
典型性 τ(ω) 的分布作为同构不变量，能将真正的模糊核与分区核区分开来。
该框架支持与任务相关的相似性敏感信息增益，并对表示学习和最优实验设计的应用提出潜在方向。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。