Skip to main content
QUICK REVIEW

[논문 리뷰] Mamba Meets Scheduling: Learning to Solve Flexible Job Shop Scheduling with Efficient Sequence Modeling

Zhi Cao, Cong Zhang|arXiv (Cornell University)|2026. 02. 25.
Scheduling and Optimization Algorithms인용 수 0
한 줄 요약

본 논문은 유연한 작업장 스케줄링을 위한 Mamba-CrossAttention(M-CA)을 제안하며, 선형 시간의 Mamba 상태 공간 모델을 사용해 엔드투엔드의 효율적 시퀀스 모델링을 가능하게 하고 FJSP 벤치마크에서 학습 기반 기준선보다 우수한 성능을 보인다.

ABSTRACT

The Flexible Job Shop Problem (FJSP) is a well-studied combinatorial optimization problem with extensive applications for manufacturing and production scheduling. It involves assigning jobs to various machines to optimize criteria, such as minimizing total completion time. Current learning-based methods in this domain often rely on localized feature extraction models, limiting their capacity to capture overarching dependencies spanning operations and machines. This paper introduces an innovative architecture that harnesses Mamba, a state-space model with linear computational complexity, to facilitate comprehensive sequence modeling tailored for FJSP. In contrast to prevalent graph-attention-based frameworks that are computationally intensive for FJSP, we show our model is more efficient. Specifically, the proposed model possesses an encoder and a decoder. The encoder incorporates a dual Mamba block to extract operation and machine features separately. Additionally, we introduce an efficient cross-attention decoder to learn interactive embeddings of operations and machines. Our experimental results demonstrate that our method achieves faster solving speed and surpasses the performance of state-of-the-art learning-based methods for FJSP across various benchmarks.

연구 동기 및 목표

  • FJSP를 효율적으로 해결하기 위해 Mamba 모델을 스케줄링 도메인으로 확장하는 것.
  • 전체 시퀀스로부터 작업-기계 간 상호 작용 임베딩을 학습하기 위해 Mamba-CrossAttention를 제안한다.
  • 그래프 기반 상태 설계를 선형 시간 시퀀스 모델링으로 대체하여 성능과 속도를 향상시킨다.
  • 다양한 FJSP 벤치마크에서 거의 최적의 해와 최첨단 결과를 입증한다.

제안 방법

  • 인코더-디코더 아키텍처로, 인코더는 이중 Mamba 블록을 사용하여 작업(오퍼레이션) 특징과 기계(머신) 특징을 분리해 추출합니다.
  • 교차 어텐션 디코더로 작업 및 기계 임베딩을 융합하고 상호 작용 표현을 학습합니다.
  • 선택 후보 쌍 특징과 함께 작업, 기계, 글로벌 특징을 연결(concatenate)하여 선택 확률을 계산하는 의사결정 네트워크.
  • Makespan 기반 보상을 갖는 가용한 작업-기계 쌍에 대한 순차적 의사결정으로 FJSP를 MDP 형태로 정리합니다.
  • 안정성을 위한 GAE를 사용하는 배우-비평가 프레임워크에서 PPO로 학습합니다.
  • 기준선과의 비교를 위해 여섯 개의 공개 FJSP 벤치마크 및 합성/대규모 인스턴스에서 평가합니다.
Figure 1. Disjunctive graph representations of JSP and FJSP with 3 jobs and 3 machines. The arrows on black lines indicate precedence within jobs, while dotted lines represent disjunctive arcs, whose directions must be determined to establish a valid schedule. Disjunctive arcs of the same color indi
Figure 1. Disjunctive graph representations of JSP and FJSP with 3 jobs and 3 machines. The arrows on black lines indicate precedence within jobs, while dotted lines represent disjunctive arcs, whose directions must be determined to establish a valid schedule. Disjunctive arcs of the same color indi

실험 결과

연구 질문

  • RQ1Mamba를 통한 전체 시퀀스 모델링이 인접 영역에 제한된 그래프 방법을 넘어 FJSP 표현 학습을 개선할 수 있는가?
  • RQ2Mamba-CrossAttention 아키텍처가 FJSP 벤치마크에서 거의 최적의 makespan을 달성하면서 더 빠른 해결 속도를 제공하는가?
  • RQ3표준 및 대규모 FJSP 인스턴스에서 M-CA가 그래프 기반 및 휴리스틱 기준선과 어떻게 비교되는가?
  • RQ4FJSP를 엔드투엔드 학습 문제로 엔코더–디코더 정책과 PPO 학습으로 효과적으로 프레이밍할 수 있는가?

주요 결과

  • M-CA는 여러 FJSP 벤치마크에서 최첨단 학습 기반 방법들보다 더 빠른 해결 속도를 달성한다.
  • 이 방법은 거의 최적의 해를 달성하고 그래프 어텐션 및 MLP 기반 방법을 포함한 다양한 기준선을 능가한다.
  • 듀얼 Mamba 인코더는 작업 및 기계 시퀀스에 대해 선형 시간 복잡도로 효율적인 특징 추출을 제공한다.
  • 교차 어텐션 디코더는 O(|O|·|M|) 복잡도로 작업과 기계 간의 효율적인 상호 작용 학습을 가능하게 한다.
  • GAE를 사용한 PPO 기반 학습은 합성 및 공개 벤치마크에서 안정적인 최적화와 강력한 성능을 제공한다.
Figure 2. The overall architecture of our proposed Mamba-CrossAttention framework. It comprises two fundamental components: the feature extraction network and the decision-making network. At each step in the scheduling process, the feature extraction network extracts raw features of operations and m
Figure 2. The overall architecture of our proposed Mamba-CrossAttention framework. It comprises two fundamental components: the feature extraction network and the decision-making network. At each step in the scheduling process, the feature extraction network extracts raw features of operations and m

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.