[论文解读] Class-Imbalanced Learning on Graphs: A Survey
本综述首次对图上的类别不平衡学习(CILG)提供了全面的概览,详细给出方法的两级分类、评估框架与未来研究方向。它将图表示学习与CIL技术联系起来,并提供一个持续维护的阅读清单和代码资源。
The rapid advancement in data-driven research has increased the demand for effective graph data analysis. However, real-world data often exhibits class imbalance, leading to poor performance of machine learning models. To overcome this challenge, class-imbalanced learning on graphs (CILG) has emerged as a promising solution that combines the strengths of graph representation learning and class-imbalanced learning. In recent years, significant progress has been made in CILG. Anticipating that such a trend will continue, this survey aims to offer a comprehensive understanding of the current state-of-the-art in CILG and provide insights for future research directions. Concerning the former, we introduce the first taxonomy of existing work and its connection to existing imbalanced learning literature. Concerning the latter, we critically analyze recent work in CILG and discuss urgent lines of inquiry within the topic. Moreover, we provide a continuously maintained reading list of papers and code at https://github.com/yihongma/CILG-Papers.
研究动机与目标
- 为图数据中的CILG提供背景与动机的介绍。
- 提出CILG方法的分类法,并与现有的不平衡学习文献联系起来。
- 对CILG的数据层面与算法层面技术,以及评估基准进行综述。
- 批判性分析当前的评估实践并提出未来研究方向。
- 为社区提供持续维护的阅读清单和代码资源。
提出的方法
- 将CILG方法分为数据层面和算法层面两类。
- 在数据层面的方法中,回顾数据插值、对抗生成与伪标签等方法。
- 在算法层面的方法中,回顾模型改进、损失函数设计与后治疗调整。
- 讨论图结构和非欧几里得数据如何影响CILG技术设计。
- 总结CILG研究中使用的数据集、训练-测试切分以及评估指标。
- 为未来的CILG研究提供指南与路线图。
实验结果
研究问题
- RQ1图上类别不平衡学习(CILG)的当前最前沿是什么?
- RQ2如何将现有的不平衡学习技术适配到图结构数据?
- RQ3常用的用于评估CILG方法的数据集、切分和指标是什么,它们的局限性在哪?
- RQ4推动未来CILG研究的关键方向和待解决挑战是什么?
- RQ5一个统一的分类法如何更好地描述CILG技术的全景并指导新工作?
主要发现
- 本文是关于图上类别不平衡学习(CILG)的第一篇全面综述。
- 它系统地将CILG方法分为数据层面和算法层面两组,并进一步细分为子类别。
- 它讨论了评估框架,包括基准数据集、训练-测试切分策略和性能指标,强调如准确率等指标的当前偏见。
- 它提供了三个未来研究方向的路线图:超越节点分类、处理复杂/异质图以及拓扑不平衡。
- 在公共仓库中提供一个持续更新的阅读清单和代码资源。
- 该综述将图表示学习与类别不平衡学习文献联系起来,以在更广泛的机器学习研究背景下对CILG进行情境化。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。