[论文解读] Inhomogeneous Hypergraph Clustering with Applications
本文提出非同质超图划分,为超边截断分配不同成本,并在子模成本下证明其对最优解的二次近似;应用于结构学习、子空间分割和基序聚类。
Hypergraph partitioning is an important problem in machine learning, computer vision and network analytics. A widely used method for hypergraph partitioning relies on minimizing a normalized sum of the costs of partitioning hyperedges across clusters. Algorithmic solutions based on this approach assume that different partitions of a hyperedge incur the same cost. However, this assumption fails to leverage the fact that different subsets of vertices within the same hyperedge may have different structural importance. We hence propose a new hypergraph clustering technique, termed inhomogeneous hypergraph partitioning, which assigns different costs to different hyperedge cuts. We prove that inhomogeneous partitioning produces a quadratic approximation to the optimal solution if the inhomogeneous costs satisfy submodularity constraints. Moreover, we demonstrate that inhomogenous partitioning offers significant performance improvements in applications such as structure learning of rankings, subspace segmentation and motif clustering.
研究动机与目标
- 在子集之间高阶关系的重要性变化时,推动超图聚类。
- 定义具有一致成本函数的非同质超边并推导归一化割目标。
- 开发基于投影的谱聚类流程,处理非同质成本。
- 在子模性下给出近似界的理论保证。
- 在排序、子空间聚类和基序网络等应用中展示实际收益。
提出的方法
- 对每个非同质超边,计算一个完备子图表示,通过一个优化问题最好地近似超边截断。
- 跨超边合并投影后的边权,得到在同一顶点集上的图,其中边权是投影的和。
- 对所得图使用归一化拉普拉斯矩阵进行经典谱聚类。
- 给出投影问题的可行解,边权非负,并讨论在子模性下确保存在性和界的条件。
- 证明若投影得到非负权重,该方法相对于超图NCut达到常数近似,其界包含β*(β-近似因子)。
- 在出现负投影权重时讨论实际注意事项并提出修正方法(例如正部分截断),并给出经验性能说明。
实验结果
研究问题
- RQ1是否能将非同质超边成本高效投影为适用于谱聚类的图表示?
- RQ2在何种条件下,子模超边权重能保证投影的可行性、非负性以及二次近似保证?
- RQ3非同质划分在基序聚类和结构学习中与同质以及成对方法相比的表现如何?
- RQ4在哪些实际应用中非同质成本能带来显著改进(如排序、子空间聚类、网络基序)?
主要发现
- 在投影权重非负且超边成本为子模时,提出的非同质划分框架对超图NCut给出常数近似。
- 投影方法将每个 inH-hyperedge 转换为图的一个分量,并跨超边聚合为全局图,使得可以使用标准工具进行谱聚类。
- 子模性在许多实际情况下保证权重投影的可行性与边权非负。
- 当权重具有子模性时,本文给出投影边权的显式公式及近似因子的界限。
- 实证结果在网络基序聚类、排序的结构学习和分层生物网络(如佛罗里达湾食物网)等应用中显示显著性能提升。
- 该方法泛化并包含若干现有超图聚类方法(如同质NCut、Clique Expansion)作为特例。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。