[論文レビュー] Finding the Missing-half: Graph Complementary Learning for Homophily-prone and Heterophily-prone Graphs
GOALはGraph Complementary Learningを導入し、欠損半トポロジーを補完して両方のトポロジーを活用する新しい補完グラフ畳み込みを学習し、8つの実世界データセットでノード分類性能を優位に向上させました。
Real-world graphs generally have only one kind of tendency in their connections. These connections are either homophily-prone or heterophily-prone. While graphs with homophily-prone edges tend to connect nodes with the same class (i.e., intra-class nodes), heterophily-prone edges tend to build relationships between nodes with different classes (i.e., inter-class nodes). Existing GNNs only take the original graph during training. The problem with this approach is that it forgets to take into consideration the ``missing-half" structural information, that is, heterophily-prone topology for homophily-prone graphs and homophily-prone topology for heterophily-prone graphs. In our paper, we introduce Graph cOmplementAry Learning, namely GOAL, which consists of two components: graph complementation and complemented graph convolution. The first component finds the missing-half structural information for a given graph to complement it. The complemented graph has two sets of graphs including both homophily- and heterophily-prone topology. In the latter component, to handle complemented graphs, we design a new graph convolution from the perspective of optimisation. The experiment results show that GOAL consistently outperforms all baselines in eight real-world datasets.
研究の動機と目的
- 同質性が高いグラフまたは異質性が高いグラフのいずれかに該当する実世界グラフにおいて、欠損半トポロジーを活用する動機づけ。
- 欠損トポロジーを発見し追加する2段階のグラフ補完パイプラインを提案します。
- 両方のトポロジーを含む補完グラフで効果的に動作できるグラフ畳み込みを開発する。
- 欠損半トポロジーを組み込むことで下流のノード分類が改善されることを示す。
- GOALの優位性を示す8つの実世界データセットを用いた実証的検証を提供する。
提案手法
- グラフ識別とグルーピングと学習-to-ランク損失を用いたトポロジー補完によるグラフ補完。
- 識別はKolmogorov-Smirnov統計を用いてグラフが同質性寄りか異質性寄りかを決定する。
- トポロジー拡張はグラフのタイプに基づき、各ノードをK個の異質性寄りノードまたはK個の同質性寄りノードに接続する。
- 補完グラフ畳み込み CGC は自己、同質、異質、及び結合寄与を制御するパラメータ alpha, beta, gamma, delta を用いて同質性寄り情報と異質性寄り情報を統合する。
- CGC は O_o(同質性)、O_t(異質性)、O_c(結合トポロジー)を含む最適化目的から導出。
- CGC を各トポロジーのラプラシアンに対するデュアルな低域/高域パスのスペクトral フィルタリング効果として解釈。
実験結果
リサーチクエスチョン
- RQ1与えられたグラフで欠損半トポロジーをどのように識別するか?
- RQ2補完グラフ上で同質性寄り接続と異質性寄り接続の両方を効果的に活用する畳み込みをどのように設計するか?
- RQ3欠損半トポロジーを組み込むことで多様なデータセットでノード分類が改善されるか?
主な発見
| データセット | MLP | GCN | GAT | APPNP | GraphSage | ChebyNet | GPR-GNN | JKNET | GOAL | |
|---|---|---|---|---|---|---|---|---|---|---|
| Cora | 72.09 ± 0.32 | 87.50 ± 1.04 | 88.25 ± 1.22 | 88.36 ± 0.61 | 88.01 ± 1.29 | 87.49 ± 0.90 | 88.65 ± 0.75 | 86.99 ± 1.60 | 88.75 ± 0.87 | 88.75 ± 0.87 |
| Citeseer | ? | 75.11 ± 1.12 | 75.75 ± 1.23 | 76.03 ± 1.27 | 75.17 ± 1.35 | 75.50 ± 0.87 | 75.70 ± 0.81 | 75.38 ± 1.30 | 77.15 ± 0.95 | |
| Pubmed | 87.47 ± 0.14 | 87.20 ± 0.52 | 85.88 ± 0.38 | 86.21 ± 0.25 | 87.39 ± 0.84 | 89.05 ± 0.29 | 88.53 ± 0.30 | 88.64 ± 0.51 | 89.25 ± 0.55 | |
| Computer | 83.59 ± 0.89 | 83.55 ± 0.38 | 85.36 ± 0.50 | 88.32 ± 0.36 | 88.54 ± 0.69 | 89.77 ± 0.36 | 87.63 ± 0.48 | 86.97 ± 0.56 | 91.33 ± 0.38 | |
| Photo | 90.49 ± 0.20 | 89.30 ± 0.82 | 90.81 ± 0.22 | 94.44 ± 0.36 | 94.23 ± 0.62 | 95.02 ± 0.41 | 94.60 ± 0.30 | 92.68 ± 0.58 | 95.60 ± 0.44 | |
| Chameleon | 46.55 ± 0.42 | 62.72 ± 2.09 | 62.19 ± 3.78 | 50.88 ± 1.18 | 58.82 ± 2.29 | 59.98 ± 1.54 | 67.96 ± 2.55 | 64.63 ± 3.08 | 71.65 ± 1.66 | |
| Squirrel | 30.67 ± 0.52 | 47.26 ± 0.34 | 51.80 ± 1.04 | 33.58 ± 1.00 | 41.19 ± 0.75 | 40.18 ± 0.55 | 49.52 ± 5.00 | 44.91 ± 1.94 | 60.53 ± 1.60 | |
| Actor | 28.75 ± 0.88 | 29.98 ± 1.18 | 28.17 ± 1.19 | 29.82 ± 0.82 | 31.76 ± 0.73 | 35.85 ± 1.05 | 30.78 ± 0.61 | 28.48 ± 1.25 | 36.46 ± 1.02 |
- GOALは8つの実世界データセットにおけるノード分類で常にすべてのベースラインを上回る。
- 異質性寄りデータセットでは、強力なアブレーション(学習済み同質トポロジーのみのGOAL)で最先端の結果を達成。
- 補完グラフとCGCを通じて両方のトポロジーを活用することで顕著な改善を示す。
- Cora, Citeseer, Pubmed, Computer, Photo, Chameleon, Squirrel, Actor を含むデータセットで定量的な改善を提供。
- アブレーション研究は性能に対するalpha, beta, gamma, deltaの重要性を示す。
- 見つかった欠損半トポロジーは8データセットにわたる同質性比率指標で評価され、その定性的有用性を支持する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。