QUICK REVIEW

[論文レビュー] Learning the Multiple Traveling Salesmen Problem with Permutation Invariant Pooling Networks

Yoav Kaempfer, Lior Wolf|arXiv (Cornell University)|Mar 26, 2018

Vehicle Routing Optimization Methods参考文献 27被引用数 61

ひとこと要約

本論文は、複数の旅行セールスマン問題(mTSP)を、セールスマン、都市、およびデポを3つの集合として扱い、置換不変プーリングとLeave-One-Outプーリング、微分可能なソフトアサインメント層、およびビーム探索を用いて、最先端のmTSP解法を上回るニューラルネットワークを提案する。

ABSTRACT

While there are optimal TSP solvers, as well as recent learning-based approaches, the generalization of the TSP to the Multiple Traveling Salesmen Problem is much less studied. Here, we design a neural network solution that treats the salesmen, cities and depot as three different sets of varying cardinalities. We apply a novel technique that combines elements from recent architectures that were developed for sets, as well as elements from graph networks. Coupled with new constraint enforcing output layers, a dedicated loss, and a search method, our solution is shown to outperform all the meta-heuristics of the leading solver in the field.

研究の動機と目的

古典的なTSPソルバーを超える難解なmTSPに対して、学習ベースの近似手法を動機づける。
変動するグループサイズ（セールスマン、デポ、都市）を扱える置換不変のマルチセットネットワークアーキテクチャを開発する。
微分可能なソフトアサインメント層と専用損失でmTSPの制約を強制し、ILP最適ラベルを用いたエンドツーエンド訓練を可能にする。
空間的重み付け機構とビーム探索を統合して高品質なmTSP解を生成する。
標準的なmTSPベンチマークにおいて、主要なメタヒューリスティクスより優れた性能を実証的に示す。

提案手法

置換不変プーリングを用いて、3つのグループ（セールスマン、デポ、都市）を扱うPointNet風のセットアーキテクチャを一般化する。
各要素について自己文脈の漏洩を避けるためLeave-One-Outプーリングを導入する。
距離に対して学習された空間ウェイトを組み込み、加重プーリング機構を作成する。
各セールスマンに対する潜在的な辺を表すm×n×nの実数値出力テンソルを生成し、次に微分可能なソフトマックス風正規化（softassign）を適用して、mTSP制約を満たす半多乱択テンソルを得る。
softoutputから最良の実現可能な経路を抽出するためにビーム探索を適用し、数値安定性のために対数確率を最大化する。
ターゲットの等価表現（セールスマンの置換と経路の方向）をすべて考慮する表現不変な損失でエンドツーエンド訓練を行う。

実験結果

リサーチクエスチョン

RQ1複数のグループ（セールスマン、デポ、都市）の順序に不変で、mTSPの可変グループサイズにスケールするニューラルネットワークをどのように設計できるか。
RQ2微分可能な制約強制層と特性化された損失を組み合わせることで、伝統的なメタヒューリスティクスを上回るmTSP解を得られるか。
RQ3都市間距離の学習された空間重み付けはmTSPの経路品質を改善するか。
RQ4自己参照なしでグループ特有の情報を保持するLeave-One-Outプーリングの影響はどれほどか。
RQ5提案手法は標準的なTSPベンチマークおよびより大規模なmTSPにどのように一般化するか。

主な発見

モデル	ビーム1	ビーム20	ビーム200	ビーム2,000
NN Baseline	28.44%	15.12%	9.24%	5.97%
ORmin	21.76%	2.51%	0.14%	<0.01%
Our w/o invariant loss	6.59%	0.57%	0.02%	<0.01%
Our w/o spatial weighting	1.79%	0.07%	0.01%	<0.01%
Our w/o LOO in the pooling	1.85%	0.04%	<0.01%	<0.01%
Our	0.95%	0.01%	<0.01%	<0.01%

提案手法は、テスト済みベンチマークで主要なmTSPソルバの全てのメタヒューリスティクスより良い結果を達成する。
表現不変の損失とLeave-One-Outプーリングは、アブレーションと比較して性能を大幅に向上させる。
加重空間プーリングとLeave-One-Out戦略は、非LOOバリアントに対して顕著な性能向上に寄与する。
対数確率最大化を伴うビーム探索は、ビームサイズを超えて高品質な最終解を生み出す。
mTSPLibおよびベンチマークデータセットにおいて、本手法は大半の設定でOR-Toolsの構成とニューラルベースラインを上回り、より大きなビームサイズで大幅な改善を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。