Skip to main content
QUICK REVIEW

[論文レビュー] Memetic Graph Clustering

Sonja Biedermann, Monika Henzinger|arXiv (Cornell University)|Jan 1, 2018
Complex Network Analysis Techniques参考文献 13被引用数 4
ひとこと要約

この論文では、マルチレベルのグラフ粗化、アンサンブルベースの再結合演算子、および局所探索を組み合わせてモジュラリティを最適化する一般化された記憶的アルゴリズム、VieClusを紹介する。多数の小さなインスタンスで1分未塔で10回目のDIMACS実装チャレンジのすべてのエントリを改善または再現することで、スケーラブルな並列化により低実行時間で高品質な解を達成するという、最先端の結果を達成している。

ABSTRACT

It is common knowledge that there is no single best strategy for graph clustering, which justifies a plethora of existing approaches. In this paper, we present a general memetic algorithm, VieClus, to tackle the graph clustering problem. This algorithm can be adapted to optimize different objective functions. A key component of our contribution are natural recombine operators that employ ensemble clusterings as well as multi-level techniques. Lastly, we combine these techniques with a scalable communication protocol, producing a system that is able to compute high-quality solutions in a short amount of time. We instantiate our scheme with local search for modularity and show that our algorithm successfully improves or reproduces all entries of the 10th DIMACS implementation~challenge under consideration using a small amount of time.

研究の動機と目的

  • さまざまな目的関数に適応可能な汎用的な記憶的アルゴリズムを、グラフクラスタリングに開発すること。
  • 単一の局所探索に依存する既存手法がしばしば局所最適解に閉じ込められることを是正すること。
  • マルチレベル粗化と進化的演算子を統合することで、解の品質と収束速度を向上させること。
  • 並列実行を支援する通信プロトコルを備えたスケーラブルな高パフォーマンスクラスタリングを実現すること。
  • モジュラリティ最大化のための10回目のDIMACS実装チャレンジベンチマークで、既存のソルバーを上回ること。

提案手法

  • アルゴリズムはマルチレベルフレームワークを採用し、再帰的なグラフ粗化により、粗いレベルでのグローバル探索を可能にする。
  • 再結合の基盤としてアンサンブルクラスタリングを用いる:2つのクラスタリングが重ね合わせ(クラスタメンバーシップの共通部分)によって結合され、新たな後継が生成される。
  • 再結合は、局所最適解への早期収束を避けるために、タイブレーキングのランダム化によって強化される。
  • 後継に対して局所探索を適用し、解を精緻化し、モジュラリティを向上させる。マルチレベル構造を活用して、効率的な精緻化が可能である。
  • スケーラブルな通信プロトコルにより、複数のプロセッサ上で並列実行が可能となり、収束が加速される。
  • アルゴリズムはモジュラリティ最適化のための局所探索を用いて実装され、標準的なDIMACSベンチマークで評価されている。

実験結果

リサーチクエスチョン

  • RQ1アンサンブルベースの再結合を備えた汎用的な記憶的アルゴリズムは、10回目のDIMACSグラフクラスタリングチャレンジで、既存の最先端ソルバーを上回ることができるか?
  • RQ2マルチレベル粗化とアンサンブル再結合の組み合わせは、解の品質と収束速度をどの程度向上させることができるか?
  • RQ31つのアルゴリズムが、多様なグラフタイプとサイズにわたり、複数の専用ソルバーを置き換えることができるか?
  • RQ4再結合におけるタイブレーキングのランダム化は、集団の多様性と最終的な解の品質にどのような影響を与えるか?
  • RQ5提案されたアルゴリズムは、小さなグラフおよび大規模グラフの両方で、短時間のうちに高品質なモジュラリティ結果を達成できるか?

主な発見

  • VieClusは、10回目のDIMACS実装チャレンジにおけるモジュラリティクラスタリングのすべてのエントリを改善または再現し、多数の小さなインスタンスで1分未塔でより良い結果を達成した。
  • astro-ph(Q = 0.745246)、cond-mat-2005(Q = 0.747181)、power(Q = 0.940974)などの複数のベンチマークグラフにおいて、以前の最良結果を上回るモジュラリティが報告された。
  • 収束プロットは、初期集団生成フェーズの直後から急速に改善が見られることを示しており、解の品質が迅速に達成されている。
  • アンサンブル再結合とマルチレベル粗化の併用により、解空間の効果的な探索が可能となり、早期収束を回避した。
  • スケーラブルな通信プロトコルにより、効率的な並列実行が可能となり、大規模グラフに対しても実用的である。
  • 結果から、VieClusはモジュラリティに基づくグラフクラスタリングの新しい最先端のヒューリスティックであることが示され、複数の専用ソルバーを1つの統合フレームワークで置き換えることが可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。