[論文レビュー] Mamba Meets Scheduling: Learning to Solve Flexible Job Shop Scheduling with Efficient Sequence Modeling
本論文は、柔軟なジョブショップスケジューリングのためのMamba-CrossAttention(M-CA)を導入し、線形時間のMamba状態空間モデルを用いてエンドツーエンドの効率的なシーケンスモデリングを実現し、FJSPベンチマークで学習ベースのベースラインを上回る。
The Flexible Job Shop Problem (FJSP) is a well-studied combinatorial optimization problem with extensive applications for manufacturing and production scheduling. It involves assigning jobs to various machines to optimize criteria, such as minimizing total completion time. Current learning-based methods in this domain often rely on localized feature extraction models, limiting their capacity to capture overarching dependencies spanning operations and machines. This paper introduces an innovative architecture that harnesses Mamba, a state-space model with linear computational complexity, to facilitate comprehensive sequence modeling tailored for FJSP. In contrast to prevalent graph-attention-based frameworks that are computationally intensive for FJSP, we show our model is more efficient. Specifically, the proposed model possesses an encoder and a decoder. The encoder incorporates a dual Mamba block to extract operation and machine features separately. Additionally, we introduce an efficient cross-attention decoder to learn interactive embeddings of operations and machines. Our experimental results demonstrate that our method achieves faster solving speed and surpasses the performance of state-of-the-art learning-based methods for FJSP across various benchmarks.
研究の動機と目的
- Mambaモデルをスケジューリング領域に拡張してFJSPを効率的に扱う。
- フルシーケンスから操作と機械の埋め込みを学習するためにMamba-CrossAttentionを提案する。
- グラフベースの状態設計を線形時間のシーケンスモデリングに置換して性能と速度を改善する。
- 多様なFJSPベンチマークで準最適解と最先端の結果を示す。
提案手法
- デュアルMambaブロックを用いてオペレーション特徴と機械特徴を別々に抽出するエンコーダ−デコーダアーキテクチャ。
- オペレーションと機械の埋め込みを結合しインタラクティブな表現を学習するクロスアテンションデコーダ。
- 候補ペア特徴とともにオペレーション、機械、グローバル特徴を結合して選択確率を計算する決定ネットワーク。
- FJSPを適格なオペレーション機械ペアの逐次決定としてMDP形式にし、メイクスパンベースの報酬を設定。
- 安定性のためGAEを用いたGAEを含む actor-critic フレームワークでPPOによるトレーニング。
- 六つの公開FJSPベンチマークと合成/大規模インスタンスでベースラインと比較して評価。

実験結果
リサーチクエスチョン
- RQ1Mambaによる全シーケンスモデリングは近接近傍制約のグラフ手法を超えてFJSPの表現学習を改善できるか。
- RQ2Mamba-CrossAttentionアーキテクチャは、FJSPベンチマークで準最適なメイクスパンを達成しつつ solving速度を向上させるか。
- RQ3M-CAはグラフベースおよびヒューリスティックベースのベースラインと標準および大規模なFJSPインスタンスでどう比較されるか。
- RQ4FJSPをエンコーダ−デコーダ方策とPPOトレーニングを用いたエンドツーエンド学習問題として効果的にフレーム化できるか。
主な発見
- M-CAは複数のFJSPベンチマークで最先端の学習ベース手法よりも高速な解法速度を達成。
- 本手法は準最適解を達成し、グラフアテンションやMLPベース手法を含むさまざまなベースラインを上回る。
- デュアルMambaエンコーダはオペレーションと機械のシーケンスに対して線形時間計算量で効率的な特徴抽出を提供。
- クロスアテンションデコーダはオペレーションと機械間の相互作用学習をO(|O|·|M|)の計算量で効率的に実現。
- PPOベースのトレーニングとGAEにより、合成・公開ベンチマーク全体で安定した最適化と強力な性能を発揮。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。