Skip to main content
QUICK REVIEW

[論文レビュー] Conditioning by adaptive sampling for robust design

David H. Brookes, Hahnbeom Park|arXiv (Cornell University)|Jan 29, 2019
Machine Learning and Algorithms参考文献 5被引用数 47
ひとこと要約

CbASは、適応サンプリングを用いて望ましい性質を条件付けることにより、事前分布を条件付けるモデルベースで微分不可能な設計問題へのアプローチを提示する。これは、稀少イベントの条件付けに焦点を当てることでオラクルの病理を抑制する。

ABSTRACT

We present a new method for design problems wherein the goal is to maximize or specify the value of one or more properties of interest. For example, in protein design, one may wish to find the protein sequence that maximizes fluorescence. We assume access to one or more, potentially black box, stochastic "oracle" predictive functions, each of which maps from input (e.g., protein sequences) design space to a distribution over a property of interest (e.g. protein fluorescence). At first glance, this problem can be framed as one of optimizing the oracle(s) with respect to the input. However, many state-of-the-art predictive models, such as neural networks, are known to suffer from pathologies, especially for data far from the training distribution. Thus we need to modulate the optimization of the oracle inputs with prior knowledge about what makes `realistic' inputs (e.g., proteins that stably fold). Herein, we propose a new method to solve this problem, Conditioning by Adaptive Sampling, which yields state-of-the-art results on a protein fluorescence problem, as compared to other recently published approaches. Formally, our method achieves its success by using model-based adaptive sampling to estimate the conditional distribution of the input sequences given the desired properties.

研究の動機と目的

  • ブラックボックス予測子を用いて、最大化または特定の関心の性質を指定することを目的とする設計問題を動機づける。
  • 訓練データから遠く離れた予測モデルの病理を、現実的な入力領域を条件付けることによって対処する。
  • 性質の望ましい条件を満たす設計をサンプリングする、原理的で事前情報に基づく方法を開発する。

提案手法

  • 実世界の例で訓練された生成モデルを用いて入力事前分布 p(x) をモデル化する。
  • 性質値に関する条件イベント S を定義し、ベイズ則により p(x|S) を計算する。
  • S が稀少な場合に条件付き密度 p(x|S) を推定するための適応的な重要度サンプリング手法を導入する。
  • KL発散を最小化することによって p(x|S) を近似するように、探索モデル q(x|φ) を繰り返し更新する。
  • 消失しない期待値と安定した最適化を得るために、対応する提案 r(t)(x) を伴う緩和イベント系列 S(t) を使用する。
  • 必要に応じて潜在変数事前分布や結合密度へアプローチを拡張する。

実験結果

リサーチクエスチョン

  • RQ1特性オラクルがブラックボックスであり、微分不可能な場合もあり得るとき、生成モデルの事前分布を望ましい特性値でどのように条件付けできるか。
  • RQ2適応的サンプリングとKLベースの更新は、稀少イベント設計ターゲットに対する条件付き分布 p(x|S) を信頼性高く近似できるか。
  • RQ3オラクル病理の取り扱いと設計を現実的な領域内に保つ点で、CbAS は既存の AM、GAN/VAE ベース、およびクロスエントロピー法とどう比較されるか。
  • RQ4厳密性または扱いやすい近似を維持しつつ、潜在変数モデルへ手法を拡張できるか。
  • RQ5タンパク質設計の応用において、異なるオラクル不確実性モデル(例: アンサンブル)に対してアプローチは頑健か。

主な発見

  • CbAS は、反復を通じて KL 発散が低下することによって、ターゲット条件付き分布への近似を示す。
  • この手法は、事前分布と条件付けイベント下で高確率領域に焦点を当てることで、オラクル病理を効果的に回避する。
  • CbAS は非微分可能なオラクルと離散的な設計空間に適用可能で、オラクルを介した逆伝播を避ける。
  • タンパク質蛍光に関する実験は、AM および DbAS の変種を含む複数のベースラインに対して有利な性能を示す。
  • 結合密度が扱える場合、潜在変数事前分布への厳密密度の定式化へ拡張可能。
  • CbAS は密度比ウェイトを介して事前分布との近接性を保ち、目的の最大化と事前遵守のバランスをとる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。