QUICK REVIEW

[論文レビュー] FRaGenLP: A Generator of Random Linear Programming Problems for Cluster Computing Systems

Leonid B. Sokolinsky, Irina M. Sokolinskaya|arXiv (Cornell University)|May 18, 2021

Graph Theory and Algorithms参考文献 31被引用数 9

ひとこと要約

FRaGenLP は、クラスターシステム上で大規模で実行可能かつ有界な線形計画法（LP）問題を並列に生成するアルゴリズムである。サポート不等式を用いて有界性と実行可能性を保証し、重複を避けるために幾何的および類似性制約を満たすランダムな制約を生成し、MPI を介した BSF スケルトンによる並列化を実装している。本手法は高いスケーラビリティを達成し、n=15,000 の 31,501 個の制約を持つ問題について、単一ノードでの生成時間を 12 分から 170 ノードでの 22 秒に短縮した。

ABSTRACT

The article presents and evaluates a scalable FRaGenLP algorithm for generating random linear programming problems of large dimension $n$ on cluster computing systems. To ensure the consistency of the problem and the boundedness of the feasible region, the constraint system includes $2n+1$ standard inequalities, called support inequalities. New random inequalities are generated and added to the system in a manner that ensures the consistency of the constraints. Furthermore, the algorithm uses two likeness metrics to prevent the addition of a new random inequality that is similar to one already present in the constraint system. The algorithm also rejects random inequalities that cannot affect the solution of the linear programming problem bounded by the support inequalities. The parallel implementation of the FRaGenLP algorithm is performed in C++ through the parallel BSF-skeleton, which encapsulates all aspects related to the MPI-based parallelization of the program. We provide the results of large-scale computational experiments on a cluster computing system to study the scalability of the FRaGenLP algorithm.

研究の動機と目的

大規模で実行可能かつ有界な線形計画法問題を、高性能ソルバーのテストに適した並列生成器としてスケーラブルに開発すること。
最適解を事前に定義せずに、生成された LP 問題の有界性と実行可能性を保証すること。
幾何的および類似性指標を用いて冗長または類似した制約を回避し、問題の多様性を向上させること。
BSF スケルトンモデルと MPI を用いて、クラスターシステムにおける効率的な並列化を実現すること。
AI を用いた LP ソルバーの開発を支援するため、大規模で多様なトレーニングデータセットを生成すること。

提案手法

2n+1 個の標準的サポート不等式を用いて、切断された超立方体に似た有界な実行可能領域を定義する。
有界な区間から抽出された係数と定数を用いた擬似乱数生成により、ランダムな不等式を生成する。
各新しい不等式は、4 つの条件を満たすことで検証される：中心点の実行可能性、中心からの距離が指定範囲内であること、中心の目的関数値を改善すること、既存の制約と類似しすぎていないこと。
平行性と近接性の 2 つの類似性指標を用いて、既存のものとあまりに類似した超平面を除外し、多様性を確保する。
並列実装では、マスタースレーブアーキテクチャを採用した BSF スケルトンモデルを用い、スレーブが制約を生成し、マスタが MPI を介して検証と集約を実行する。
アルゴリズムは C++ で実装され、再現性と再利用を目的としてオープンソース化されている。

実験結果

リサーチクエスチョン

RQ1解のバイアスを避けるために、大規模で実行可能かつ有界な LP 問題をスケーラブルに並列生成する方法は何か？
RQ2最適解を事前に固定せずに、有界性と実行可能性を保証するための幾何的および構造的制約は何か？
RQ3制約間の類似性を形式的に測定する方法は何か？これにより冗長性を回避し、問題の多様性を向上させられるか？
RQ4FRaGenLP アルゴリズムは、問題次元が増加する際、クラスターシステム上でどの程度スケーラブルか？
RQ5この生成器は、AI を用いた LP ソルバーのトレーニングに適した大規模で多様なデータセットを生成できるか？

主な発見

FRaGenLP アルゴリズムは、最適解が未知のまま、大規模で実行可能かつ有界な LP 問題を効果的に生成でき、高性能ソルバーのテストに適している。
n=15,000 および 31,501 個の制約を持つ問題について、単一ノードでの生成時間を 12 分から 171 ノードでの 22 秒に短縮した。これは、並列処理における高い効率性を示している。
問題サイズが大きくなるにつれ、スケーラビリティの上限も上昇した：n=3,000 の場合約 50 ノード、n=5,500 の場合約 110 ノード、n=15,000 の場合約 200 ノード。
ランダムな不等式の数を 10 倍に増やすと、マスターノードの直列処理負荷が増加し、スケーラビリティの上限が半減した。
生成器は 70,000 個のサンプルから成るデータセットを生成し、高速な LP 解法を実現するための人工ニューラルネットワークのトレーニングに使用した。
サポート不等式と類似性指標の使用により、生成された問題の有界性、実行可能性、多様性が保証された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。