[论文解读] FRaGenLP: A Generator of Random Linear Programming Problems for Cluster Computing Systems
FRaGenLP 是一种在集群系统上生成大规模、可行、有界线性规划(LP)问题的并行算法。它使用支持不等式确保有界性和可行性,通过几何和相似性约束生成随机约束以避免冗余,并采用基于 MPI 的 BSF-骨架并行化方法。该方法具有高可扩展性,对于 n=15,000 且含 31,501 个约束的问题,生成时间从单节点的 12 分钟减少至 170 个节点的 22 秒。
The article presents and evaluates a scalable FRaGenLP algorithm for generating random linear programming problems of large dimension $n$ on cluster computing systems. To ensure the consistency of the problem and the boundedness of the feasible region, the constraint system includes $2n+1$ standard inequalities, called support inequalities. New random inequalities are generated and added to the system in a manner that ensures the consistency of the constraints. Furthermore, the algorithm uses two likeness metrics to prevent the addition of a new random inequality that is similar to one already present in the constraint system. The algorithm also rejects random inequalities that cannot affect the solution of the linear programming problem bounded by the support inequalities. The parallel implementation of the FRaGenLP algorithm is performed in C++ through the parallel BSF-skeleton, which encapsulates all aspects related to the MPI-based parallelization of the program. We provide the results of large-scale computational experiments on a cluster computing system to study the scalability of the FRaGenLP algorithm.
研究动机与目标
- 开发一种可扩展的并行生成器,用于生成大规模、可行、有界线性规划问题,适用于高性能求解器的测试。
- 在不预先定义最优解的情况下,确保生成的 LP 问题具有有界性和可行性,同时保持随机性。
- 通过几何和相似性度量防止冗余或相似的约束,提升问题的多样性。
- 利用 BSF-骨架模型和 MPI 实现集群系统上的高效并行化。
- 通过生成大规模、多样化的训练数据集,支持基于人工智能的 LP 求解器的开发。
提出的方法
- 该方法使用 2n+1 个标准支持不等式,定义一个形如截断超立方体的有界可行区域。
- 通过从有界区间中抽取系数和常数的伪随机数生成器,生成随机不等式。
- 每个新不等式通过四个条件进行验证:中心点的可行性、中心点距离在指定范围内、目标值优于中心点、与已有约束不相似。
- 采用两种相似性度量——平行性和接近度——以拒绝与已有超平面过于相似的平面,确保多样性。
- 并行实现采用主从架构的 BSF-骨架模型,其中从节点生成约束,主节点通过 MPI 执行验证和聚合。
- 该算法使用 C++ 实现,并已开源,以确保可重现性和可重用性。
实验结果
研究问题
- RQ1如何设计一种可扩展的并行生成器,用于大规模、可行、有界 LP 问题,以避免解的偏差?
- RQ2哪些几何和结构约束可在不预先固定最优解的情况下,确保有界性和可行性?
- RQ3如何形式化度量约束之间的相似性,以避免冗余并提升问题多样性?
- RQ4FRaGenLP 算法在集群系统上随问题维度增加的可扩展性如何?
- RQ5该生成器能否生成大规模、多样化的数据集,以用于训练基于人工智能的 LP 求解器?
主要发现
- FRaGenLP 算法成功生成了大规模、可行、有界且最优解未知的 LP 问题,适用于高性能求解器的测试。
- 对于 n=15,000 且含 31,501 个约束的问题,生成时间从单节点的 12 分钟降至 171 个节点的 22 秒,表明具有出色的并行效率。
- 可扩展性上限随问题规模增加而提高:n=3,000 时约为 50 个节点,n=5,500 时为 110 个节点,n=15,000 时为 200 个节点。
- 将随机不等式数量增加 10 倍后,可扩展性上限降低一半,原因是主节点的串行工作负载显著增加。
- 该生成器生成了包含 70,000 个样本的数据集,用于训练人工神经网络以实现快速 LP 求解。
- 支持不等式与相似性度量的结合,确保了生成问题的有界性、可行性与多样性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。