QUICK REVIEW

[論文レビュー] DIFUSCO: Graph-based Diffusion Solvers for Combinatorial Optimization

Zhiqing Sun, Yiming Yang|arXiv (Cornell University)|Feb 16, 2023

Machine Learning and Algorithms被引用数 20

ひとこと要約

DIFUSCOはグラフベースの離散拡散モデルを導入し、並列デノイジングとマルチモーダル解生成によりNP困難な組合せ最適化問題を解く。TSPとMISで最先端の結果を達成する。

ABSTRACT

Neural network-based Combinatorial Optimization (CO) methods have shown promising results in solving various NP-complete (NPC) problems without relying on hand-crafted domain knowledge. This paper broadens the current scope of neural solvers for NPC problems by introducing a new graph-based diffusion framework, namely DIFUSCO. Our framework casts NPC problems as discrete {0, 1}-vector optimization problems and leverages graph-based denoising diffusion models to generate high-quality solutions. We investigate two types of diffusion models with Gaussian and Bernoulli noise, respectively, and devise an effective inference schedule to enhance the solution quality. We evaluate our methods on two well-studied NPC combinatorial optimization problems: Traveling Salesman Problem (TSP) and Maximal Independent Set (MIS). Experimental results show that DIFUSCO strongly outperforms the previous state-of-the-art neural solvers, improving the performance gap between ground-truth and neural solvers from 1.76% to 0.46% on TSP-500, from 2.46% to 1.17% on TSP-1000, and from 3.19% to 2.58% on TSP10000. For the MIS problem, DIFUSCO outperforms the previous state-of-the-art neural solver on the challenging SATLIB benchmark.

研究の動機と目的

ニューロナルCOソリューションを自己回帰およびRLベースの手法の範囲を超えて拡張するグラフベース拡散フレームワークを導入する。
NPC問題を{0,1}-valuedベクトルとして表現し、グラフ拡散デノイズを用いて高品質な解を生成する。
Gaussian（連続）対 Bernoulli（離散）拡散を比較し、効果的な推論スケジュールを特定する。
大規模なTSPインスタンスとMISベンチマークでのスケーラビリティと高い性能を示す。

提案手法

グラフ構造化されたインスタンス上の{0,1}-ベクトル最適化としてNPC問題を定式化する。
グラフニューラルネットワーク（Anisotropic GNN）を用いてインスタンスを符号化し、拡散フレームワークで破壊された{0,1}変数をデノイズする。
Bernoulliノイズによる離散拡散とGaussianノイズによる連続拡散を探索；RLではなく教師ありデノイジングで訓練する。
離散拡散のためのDDIM風スケジュール（線形とコサイン）を用いて高速推論を設計し、品質を維持しつつステップ数を削減する。
ヒートマップと問題特有の戦略（TSPでは2-optを用いた greedy、MISでは greedy）で解をデコードし、複数のサンプルを実行する。

DIFUSCO: Graph-based Diffusion Solvers for Combinatorial Optimization

実験結果

リサーチクエスチョン

RQ1グラフベースの拡散モデルはNPC問題に対して高品質でマルチモーダルな解を生成できるか？
RQ2グラフベースのCOタスクにおいて離散Bernoulli拡散と連続Gaussian拡散はどのように比較されるか？
RQ3TSPとMISに対して最良の性能と効率性をもたらす推論スケジュールとデコード戦略は何か？
RQ4DIFUSCOモデルは一つのスケールで訓練された後、より大きなTSPインスタンスや別のMISベンチマークへ一般化できるか？

主な発見

アルゴリズム	タイプ	TSP-50 長さ	TSP-50 ギャップ	TSP-100 長さ	TSP-100 ギャップ
Concorde ∗	Exact	5.69	0.00	7.76	0.00
2-OPT	Heuristics	5.86	2.95	8.03	3.54
AM	Greedy	5.80	1.76	8.12	4.53
GCN	Greedy	5.87	3.10	8.41	8.38
Transformer	Greedy	5.71	0.31	7.88	1.42
POMO	Greedy	5.73	0.64	7.84	1.07
Sym-NCO	Greedy	-	-	7.84	0.94
DPDP	$1k$-Improvements	5.70	0.14	7.89	1.62
Ours	Greedy †	5.70	0.10	7.78	0.24
AM	$1k\times$ Sampling	5.73	0.52	7.94	2.26
GCN	$2k\times$ Sampling	5.70	0.01	7.87	1.39
Transformer	$2k\times$ Sampling	5.69	0.00	7.76	0.39
POMO	$8\times$ Augment	5.69	0.03	7.77	0.14
Sym-NCO	$100\times$ Sampling	-	-	7.79	0.39
MDAM	$50\times$ Sampling	5.70	0.03	7.79	0.38
Ours	$16\times$ Sampling	5.69	-0.01	7.76	-0.01

離散拡散は、数ステップ以上の拡散を用いる場合、NPC問題に対して連続拡散を大幅に上回る。
等角デノイズスケジュールは離散拡散において線形より優れており、品質を保ちながら高速推論を可能にする。
TSPではDIFUSCOは ground-truth との差を1.76%から0.46%へ縮める（MCTS使用時、TSP-500）、TSP-1000では2.46%から1.17%、TSP-10000では3.19%から2.58%へ。
MIS on SATLIBベンチマークで、DIFUSCOは従来のニューラルソルバーと比較して最先端の性能を達成。
単一のAnisotropic GNNバックボーンで同一フレームワーク内のTSPとMISの両方を解ける。
DIFUSCOはTSPスケール間で良く一般化し、クロススケールのテストでRL-またはSL訓練済みの非自己回帰法を上回ることが多い。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。