Skip to main content
QUICK REVIEW

[論文レビュー] Learning the Multiple Traveling Salesmen Problem with Permutation Invariant Pooling Networks

Yoav Kaempfer, Lior Wolf|arXiv (Cornell University)|Mar 26, 2018
Vehicle Routing Optimization Methods参考文献 27被引用数 61
ひとこと要約

本論文は、複数の旅行セールスマン問題(mTSP)を、セールスマン、都市、およびデポを3つの集合として扱い、置換不変プーリングとLeave-One-Outプーリング、微分可能なソフトアサインメント層、およびビーム探索を用いて、最先端のmTSP解法を上回るニューラルネットワークを提案する。

ABSTRACT

While there are optimal TSP solvers, as well as recent learning-based approaches, the generalization of the TSP to the Multiple Traveling Salesmen Problem is much less studied. Here, we design a neural network solution that treats the salesmen, cities and depot as three different sets of varying cardinalities. We apply a novel technique that combines elements from recent architectures that were developed for sets, as well as elements from graph networks. Coupled with new constraint enforcing output layers, a dedicated loss, and a search method, our solution is shown to outperform all the meta-heuristics of the leading solver in the field.

研究の動機と目的

  • 古典的なTSPソルバーを超える難解なmTSPに対して、学習ベースの近似手法を動機づける。
  • 変動するグループサイズ(セールスマン、デポ、都市)を扱える置換不変のマルチセットネットワークアーキテクチャを開発する。
  • 微分可能なソフトアサインメント層と専用損失でmTSPの制約を強制し、ILP最適ラベルを用いたエンドツーエンド訓練を可能にする。
  • 空間的重み付け機構とビーム探索を統合して高品質なmTSP解を生成する。
  • 標準的なmTSPベンチマークにおいて、主要なメタヒューリスティクスより優れた性能を実証的に示す。

提案手法

  • 置換不変プーリングを用いて、3つのグループ(セールスマン、デポ、都市)を扱うPointNet風のセットアーキテクチャを一般化する。
  • 各要素について自己文脈の漏洩を避けるためLeave-One-Outプーリングを導入する。
  • 距離に対して学習された空間ウェイトを組み込み、加重プーリング機構を作成する。
  • 各セールスマンに対する潜在的な辺を表すm×n×nの実数値出力テンソルを生成し、次に微分可能なソフトマックス風正規化(softassign)を適用して、mTSP制約を満たす半多乱択テンソルを得る。
  • softoutputから最良の実現可能な経路を抽出するためにビーム探索を適用し、数値安定性のために対数確率を最大化する。
  • ターゲットの等価表現(セールスマンの置換と経路の方向)をすべて考慮する表現不変な損失でエンドツーエンド訓練を行う。

実験結果

リサーチクエスチョン

  • RQ1複数のグループ(セールスマン、デポ、都市)の順序に不変で、mTSPの可変グループサイズにスケールするニューラルネットワークをどのように設計できるか。
  • RQ2微分可能な制約強制層と特性化された損失を組み合わせることで、伝統的なメタヒューリスティクスを上回るmTSP解を得られるか。
  • RQ3都市間距離の学習された空間重み付けはmTSPの経路品質を改善するか。
  • RQ4自己参照なしでグループ特有の情報を保持するLeave-One-Outプーリングの影響はどれほどか。
  • RQ5提案手法は標準的なTSPベンチマークおよびより大規模なmTSPにどのように一般化するか。

主な発見

モデルビーム1ビーム20ビーム200ビーム2,000
NN Baseline28.44%15.12%9.24%5.97%
ORmin21.76%2.51%0.14%<0.01%
Our w/o invariant loss6.59%0.57%0.02%<0.01%
Our w/o spatial weighting1.79%0.07%0.01%<0.01%
Our w/o LOO in the pooling1.85%0.04%<0.01%<0.01%
Our0.95%0.01%<0.01%<0.01%
  • 提案手法は、テスト済みベンチマークで主要なmTSPソルバの全てのメタヒューリスティクスより良い結果を達成する。
  • 表現不変の損失とLeave-One-Outプーリングは、アブレーションと比較して性能を大幅に向上させる。
  • 加重空間プーリングとLeave-One-Out戦略は、非LOOバリアントに対して顕著な性能向上に寄与する。
  • 対数確率最大化を伴うビーム探索は、ビームサイズを超えて高品質な最終解を生み出す。
  • mTSPLibおよびベンチマークデータセットにおいて、本手法は大半の設定でOR-Toolsの構成とニューラルベースラインを上回り、より大きなビームサイズで大幅な改善を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。