[論文レビュー] Algorithm Evolution Using Large Language Model
本論文は、アルゴリズムを自動設計するためにLLMを活用する進化的フレームワークであるAlgorithm Evolution using Large Language Model (AEL)を紹介し、TSP構築ヒューリスティックで実証する。AELは手作業の貪欲法とドメイン学習モデルを上回り、問題サイズ全体での一般化性能が向上する。
Optimization can be found in many real-life applications. Designing an effective algorithm for a specific optimization problem typically requires a tedious amount of effort from human experts with domain knowledge and algorithm design skills. In this paper, we propose a novel approach called Algorithm Evolution using Large Language Model (AEL). It utilizes a large language model (LLM) to automatically generate optimization algorithms via an evolutionary framework. AEL does algorithm-level evolution without model training. Human effort and requirements for domain knowledge can be significantly reduced. We take constructive methods for the salesman traveling problem as a test example, we show that the constructive algorithm obtained by AEL outperforms simple hand-crafted and LLM-generated heuristics. Compared with other domain deep learning model-based algorithms, these methods exhibit excellent scalability across different problem sizes. AEL is also very different from previous attempts that utilize LLMs as search operators in algorithms.
研究の動機と目的
- LLMを自動アルゴリズム設計の進化フレームワークに統合して、アルゴリズム設計の手動エキスパート作業を削減する。
- 構築的TSPヒューリスティックでAELを実証し、競争力がありスケーラブルなアルゴリズムを作成する。
- 人間設計・ドメイン学習・直接指示LLM生成アルゴリズムとAELを比較して、性能と一般化を評価する。
提案手法
- 各アルゴリズムを、自然言語の説明、事前定義されたコードブロック、フィットネス値を含む進化個体として表現する。
- 初期化、選択、交叉(LLM promptsを用いる)、突然変異(LLM promptsを用いる)、集団管理を伴う進化ループを用いてアルゴリズムを進化させる。
- 多様性と問題特有のフォーマットを促進する制約を付けて、新しいアルゴリズムを生成したり既存のものを修正するためにLLMをプロンプトエンジニアリングする。
- 各候補アルゴリズムを問題インスタンスのバッチで評価して、インスタンスを横断する平均ギャップ(ソルバーに対するギャップ)をフィットネスとして算出する。
- ベースラインの人間設計のGreedy、ドメインモデル(ニューラルソルバー)、直接指示されたLLM生成アルゴリズムと比較する。
実験結果
リサーチクエスチョン
- RQ1LLMを活用した進化フレームワークは、TSPのような組合せ最適化問題に対して競争力のあるアルゴリズムを自動設計できるか。
- RQ2AELは人が設計したヒューリスティクス、ドメインモデルのソルバー、直接LLMプロンプトと比較して、解の品質と問題サイズを超えた一般化においてどうなるか。
- RQ3高度なLLM(例:GPT-4)を使用することが、進化したアルゴリズムの品質と頑健性に与える影響は何か。
主な発見
| アルゴリズム | 20 距離 | 20 ギャップ | 50 距離 | 50 ギャップ | 100 距離 | 100 ギャップ | 200 距離 | 200 ギャップ | 500 距離 | 500 ギャップ | 1000 距離 | 1000 ギャップ |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ベースライン (LKH3) | 3.84 | / | 5.69 | / | 7.77 | / | 10.73 | / | 16.56 | / | 23.08 | / |
| 人間 (Greedy) | 4.49 | 17.0% | 7.01 | 23.1% | 9.84 | 26.6% | 13.50 | 25.8% | 20.87 | 26.0% | 28.90 | 25.2% |
| ドメインモデル | 3.86 | 0.6% | 5.71 | 0.4% | 8.01 | 3.0% | 13.02 | 21.3% | 24.34 | 47.0% | 36.53 | 58.3% |
| LLM (Average) GPT-3.5-turbo | 5.04 | 31.3% | 7.56 | 32.8% | 10.62 | 36.7% | 14.35 | 33.7% | 22.04 | 33.1% | 30.05 | 30.2% |
| LLM (Average) GPT-4 | 7.45 | 94.2% | 14.97 | 162.9% | 24.87 | 220.1% | 37.36 | 248.0% | 61.73 | 272.8% | 86.26 | 273.8% |
| LLM (Best) GPT-3.5-turbo | 4.61 | 20.3% | 6.71 | 17.9% | 10.01 | 28.9% | 13.31 | 24.0% | 20.83 | 25.8% | 28.98 | 25.6% |
| LLM (Best) GPT-4 | 4.36 | 13.6% | 6.82 | 19.7% | 9.95 | 28.1% | 13.94 | 29.9% | 22.07 | 33.3% | 30.36 | 31.6% |
| AEL (Ours) GPT-3.5-turbo | 4.26 | 11.2% | 6.65 | 16.8% | 9.32 | 20.0% | 13.07 | 21.8% | 20.38 | 23.1% | 28.34 | 22.8% |
| AEL (Ours) GPT-4 | 4.07 | 6.2% | 6.33 | 11.1% | 8.58 | 10.5% | 11.94 | 11.2% | 18.67 | 12.8% | 26.03 | 12.8% |
- AELは tested サイズ全てにおいて手作業設計のGreedyヒューリスティックを一貫して上回る。
- AELは特に大規模インスタンスで、ドメイン学習モデルよりも一般化性が高い。
- LLMを直接用いてアルゴリズムを設計するプロンプトはAELより劣っており、GPT-4は時に過度なランダム性を導入する。
- 最良のAEL由来アルゴリズムは、多因子スコアリング(距離、平均距離、分散)と貧弱な選択を回避する閾値を組み合わせ、経路を著しく短くする。
- GPT-4ベースのAELは、AELフレームワーク内で通常GPT-3.5-turboよりも優れている。
- TSPサイズを20から1000まで横断して、AEL with GPT-4が他手法と比較して最も小さな平均ギャップを達成する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。