QUICK REVIEW

[論文レビュー] Symbolic Regression via Neural-Guided Genetic Programming Population Seeding

T. Nathan Mundhenk, Mikel Landajuela|arXiv (Cornell University)|Oct 29, 2021

Evolutionary Algorithms and Applications被引用数 37

ひとこと要約

遺伝的プログラミングの集団を神経ガイド付き探索サンプルで種付けし、それを進化させて symbolic regression の性能を向上させるハイブリッド手法。

ABSTRACT

Symbolic regression is the process of identifying mathematical expressions that fit observed output from a black-box process. It is a discrete optimization problem generally believed to be NP-hard. Prior approaches to solving the problem include neural-guided search (e.g. using reinforcement learning) and genetic programming. In this work, we introduce a hybrid neural-guided/genetic programming approach to symbolic regression and other combinatorial optimization problems. We propose a neural-guided component used to seed the starting population of a random restart genetic programming component, gradually learning better starting populations. On a number of common benchmark tasks to recover underlying expressions from a dataset, our method recovers 65% more expressions than a recently published top-performing model using the same experimental setup. We demonstrate that running many genetic programming generations without interdependence on the neural-guided component performs better for symbolic regression than alternative formulations where the two are more strongly coupled. Finally, we introduce a new set of 22 symbolic regression benchmark problems with increased difficulty over existing benchmarks. Source code is provided at www.github.com/brendenpetersen/deep-symbolic-optimization.

研究の動機と目的

NP-hard symbolic regression の問題を神経-guided search と遺伝的プログラミングのシーディングを組み合わせて動機づけ・対処する。
自己回帰型ニューラルシーケンス生成器がGP集団を種付けし、それが進化してニューラルトレーナーを情報提供する、二成分システムを開発する。
ニューラルガイド付きシーディングによる多くのGP世代が強く結合した代替案を上回り、探索を改善することを示す。

提案手法

expressions を前順走査の代数式木として表す。
自己回帰RNNをシーケンス生成器として使用し、候補式のバッチを出力する。
GP開始集団をRNNバッチでシードし、S GP世代を実行する。
NRMS Eベースの適応度で式を評価し、報酬 R(τ)=1/(1+NRMSE) に変換する。
RNNを三つのオプションで訓練する: Vanilla Policy Gradient (VPG)、Risk-Seeking Policy Gradient (RSPG)、または Priority Queue Training (PQT)。
GP操作をタスク固有の制約を満たすように制約し、多様性のために複数の突然変異タイプを許可する。

実験結果

リサーチクエスチョン

RQ1ニューラルガイド付きサンプリングはGP集団を効果的に種付けして symbolic regression の回復率を改善できるか？
RQ2RNN訓練ステップごとのGP世代数を変えると（S）、性能と探索はどう変わるか？
RQ3緩く結合したハイブリッド（GP_seeded-RNN訓練）は、象徴回帰において厳密に結合したものや単一コンポーネントのアプローチより効果的か？
RQ4異なるRNN訓練戦略（VPG、RSPG、PQT）がこのハイブリッド設定全体の性能に与える影響は？
RQ5制約と多様なGP突然変異演算子は回復と一般化を有意に改善するか？

主な発見

提案ハイブリッド法は、同じ設定下で共通のベンチマーク上、最近の高性能モデルよりも expressions を65%多く回復する。
GP はRNNサンプルを段階的に学習していくようなループで動作し、時間とともにより良い開始集団を可能にする。
ニューラル要素への強い相互依存なしに複数GP世代を回すことは、厳密に結合したバリアントを上回ることがある。
Nguyen ベンチマーク問題で、本手法は DSR, PQT, VPG, GP, Eureqa などのいくつかのベースラインより高い回復率を平均的に上回る。
難易度を上げた新しい Livermore ベンチマークセットを導入して、symbolic regression 手法をストレステストした。
アブレーションは PQT、適切な GP 多様性、制約の実施が頑健な性能に寄与することを示し、完全な on-policy もしくは off-policy の極端は結果を低下させる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。