[论文解读] Graph Data Augmentation for Graph Machine Learning: A Survey
对图数据增强(GDA)方法、分类、学习型与基于规则的方法之间的对比,以及图ML中的未来挑战的全面综述。
Data augmentation has recently seen increased interest in graph machine learning given its demonstrated ability to improve model performance and generalization by added training data. Despite this recent surge, the area is still relatively under-explored, due to the challenges brought by complex, non-Euclidean structure of graph data, which limits the direct analogizing of traditional augmentation operations on other types of image, video or text data. Our work aims to give a necessary and timely overview of existing graph data augmentation methods; notably, we present a comprehensive and systematic survey of graph data augmentation approaches, summarizing the literature in a structured manner. We first introduce three different taxonomies for categorizing graph data augmentation methods from the data, task, and learning perspectives, respectively. Next, we introduce recent advances in graph data augmentation, differentiated by their methodologies and applications. We conclude by outlining currently unsolved challenges and directions for future research. Overall, our work aims to clarify the landscape of existing literature in graph data augmentation and motivates additional work in this area, providing a helpful resource for researchers and practitioners in the broader graph machine learning domain. Additionally, we provide a continuously updated reading list at https://github.com/zhao-tong/graph-data-augmentation-papers.
研究动机与目标
- 澄清在图神经网络(GNNs)中进行图数据增强(GDA)的动机。
- 从数据、任务和学习视角提供一个结构化的GDA方法分类体系。
- 总结在节点级、边级和图级任务中的代表性GDA技术及其应用。
- 识别尚未解决的挑战并提出GDA未来研究的方向。
提出的方法
- 提出三种正交的分类体系:操作的数据模态(结构、特征、标签增强)、下游任务(节点/边/图)以及学习范式(基于规则 vs 学习型)。
- 描述分为数据移除、数据添加和数据操作的基于规则的GDA技术,并给出代表性方法。
- 描述学习型GDA技术,包括图结构学习、图对抗训练、图合理化和自动化增强。
- 通过对比学习、非对比学习和一致性目标,总结GDA在自监督学习中的应用。
- 在第7节中提供关于挑战与未来方向的综合视图。
实验结果
研究问题
- RQ1图数据增强技术的主要类别有哪些,如何从多种视角对其进行结构化?
- RQ2基于规则的和学习型GDA方法有何不同,每一类别中的代表性方法有哪些?
- RQ3在图机器学习(GML)中推进图数据增强目前面临哪些挑战和开放方向?
主要发现
- 基于规则的GDA方法因简单性和高效性而被广泛使用。
- GDA 技术可归类为数据移除、数据添加和数据操作,且可应用于节点级、边级和图级任务。
- 学习型GDA方法包括 Graph Structure Learning、Graph Adversarial Training、Graph Rationalization 和 Automated Augmentation。
- GDA 方法也被用于自监督学习,使用对比学习、非对比学习和一致性训练等目标。
- 该综述突出尚未解决的挑战和未来的研究方向,包括领域自适应、可扩展性、评估标准和理论基础。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。