Skip to main content
QUICK REVIEW

[論文レビュー] Class-Imbalanced Learning on Graphs: A Survey

Yihong Ma, Yijun Tian|arXiv (Cornell University)|Apr 9, 2023
Imbalanced Data Classification Techniques被引用数 10
ひとこと要約

この調査は、グラフ上のクラス不均衡学習(CILG)についての初の包括的な総覧を提供し、手法の二層分類、評価フレームワーク、今後の研究方向を詳述する。グラフ表現学習とCIL技術を結びつけ、維持されたリーディングリストとコードリソースを提供する。

ABSTRACT

The rapid advancement in data-driven research has increased the demand for effective graph data analysis. However, real-world data often exhibits class imbalance, leading to poor performance of machine learning models. To overcome this challenge, class-imbalanced learning on graphs (CILG) has emerged as a promising solution that combines the strengths of graph representation learning and class-imbalanced learning. In recent years, significant progress has been made in CILG. Anticipating that such a trend will continue, this survey aims to offer a comprehensive understanding of the current state-of-the-art in CILG and provide insights for future research directions. Concerning the former, we introduce the first taxonomy of existing work and its connection to existing imbalanced learning literature. Concerning the latter, we critically analyze recent work in CILG and discuss urgent lines of inquiry within the topic. Moreover, we provide a continuously maintained reading list of papers and code at https://github.com/yihongma/CILG-Papers.

研究の動機と目的

  • グラフデータにおけるCILGの背景と動機を紹介する。
  • CILG手法の分類法を提示し、既存の不均衡学習文献と接続する。
  • CILGのデータレベルおよびアルゴリズムレベルの手法を調査し、評価ベンチマークを含む。
  • 現在の評価実践を批判的に分析し、将来の研究方向を提案する。
  • コミュニティのための維持されたリーディングリストとコードリソースを提供する。

提案手法

  • データレベルとアルゴリズムレベルのカテゴリにCILG手法を分類する。
  • データレベル手法の中で、データ補間、敵対的生成、疑似ラベリングアプローチを検討する。
  • アルゴリズムレベル手法の中で、モデル改良、損失関数設計、ポストホック調整を検討する。
  • グラフ構造と非ユークリッドデータがCILG技術設計に与える影響を議論する。
  • CILG研究で用いられるデータセット、訓練-テスト分割、評価指標を要約する。
  • 将来のCILG研究のための指針とロードマップを提供する。

実験結果

リサーチクエスチョン

  • RQ1グラフ上のクラス不均衡学習(CILG)における現状の最先端はどこか?
  • RQ2既存の不均衡学習技術をグラフ構造データに適用するにはどうすれば良いか?
  • RQ3CILG手法を評価する際に一般的に用いられるデータセット、分割、指標は何であり、それらにはどんな制限があるか?
  • RQ4将来のCILG研究を導く主要な方向性と未解決の課題は何か?
  • RQ5統一的な分類法はCILG技術の landscape をよりよく説明し、新しい研究をどのように導くことができるか?

主な発見

  • 本論文はグラフ上のクラス不均衡学習(CILG)に関する初の包括的調査である。
  • CILG手法をデータレベルとアルゴリズムレベルのグループに体系的に分類し、さらにサブカテゴリに分割している。
  • 評価フレームワークを議論しており、ベンチマークデータセット、訓練-テスト分割戦略、性能指標を含み、精度などの指標に現在の偏りを強調している。
  • ノード分類を越えた将来の研究方向性、複雑/異質グラフの扱い、トポロジーの不均衡に関するロードマップを提供している。
  • 公的リポジトリで継続的に更新されるリーディングリストとコードリソースが提供されている。
  • この調査はグラフ表現学習とクラス不均衡学習文献を結びつけ、CILGをより広いML研究の文脈で位置づけている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。