QUICK REVIEW

[論文レビュー] Designing RNAs with Language Models

Milan Gautam, Ning Dai|arXiv (Cornell University)|Feb 12, 2026

RNA and protein synthesis mechanisms被引用数 0

ひとこと要約

論文はRNAデザインを条件付きシーケンス生成として再定義し、事前学習済みの自己回帰言語モデルを用いる。ランダム誘導構造–配列ペアでの教師あり学習と、選択された小規模な構造セットでの強化学習を組み合わせ、最先端の方法を上回りつつ高速化。

ABSTRACT

RNA design, the task of finding a sequence that folds into a target secondary structure, has broad biological and biomedical impact but remains computationally challenging due to the exponentially large sequence space and exponentially many competing folds. Traditional approaches treat it as an optimization problem, relying on per-instance heuristics or constraint-based search. We instead reframe RNA design as conditional sequence generation and introduce a reusable neural approximator, instantiated as an autoregressive language model (LM), that maps target structures directly to sequences. We first train our model in a supervised setting on random-induced structure-sequence pairs, and then use reinforcement learning (RL) to optimize end-to-end metrics. We also propose methods to select a small subset for RL that greatly improves RL efficiency and quality. Across four datasets, our approach outperforms state-of-the-art systems on key metrics such as Boltzmann probability while being 1.7x faster, establishing conditional LM generation as a scalable, task-agnostic alternative to per-instance optimization for RNA design. Our code and data are available at https://github.com/KuNyaa/RNA-Design-LM.

研究の動機と目的

ターゲット構造を条件としてRNAデザイン（逆折り畳み）を条件付きシーケンス生成として再 framingする。
ターゲット構造をマップする再利用可能なニューラル近似器（言語モデル）を開発する。
生成時の生化学的妥当性を制約付きデコードで保証する。
構造–配列ペアに対する教師あり学習と強化学習を組み合わせ、折り畳み指標を最適化する。
ランダム誘導SLデータがテストセットへの競争力ある転移を生み、効率的な構造選択でスケーラブルなRLを可能にすることを示す。

提案手法

ターゲット構造を条件として自己回帰LMを使った条件付きシーケンス生成としてRNAデザインを位置づける。
生成時に塩基対規則を強制する制約付きデコード機構を導入し、有効なデザインを保証する。
RNAトークンと構造プロンプトに対する最小限のアーキテクチャ変更で、事前学習済みGPT様デコーダLM（Qwen2.5–0.5B）を適応させる。
SAMFEOを介して生成された大規模なランダム誘導構造–配列データセットに対して教師あり学習を行い、yX_train（1000万ペア）を作成する。
選択された構造に対してグループ相対方策目的（GRPO）で報酬を熱力学的に最適化する強化学習でファインチューニングする。
サンプル多様性（AoNおよびNSD閾値）に基づくRLターゲットのデータ駆動的サブセット選択を用いて、RLの効率と質を改善する。

Figure 1: RNA design is the inverse problem of RNA folding.

実験結果

リサーチクエスチョン

RQ1RNAデザインを再利用可能なニューラルソルバーを用いた条件付きシーケンス生成として効果的に解けるか。
RQ2制約付きデコードと事前学習LM適応は、与えられたターゲット構造に対して妥当で高品質なRNAデザインを生み出すか。
RQ3ランダム誘導構造–配列ペアでの教師あり学習はテストデータセットへ転移し、効果的なRLを可能にするか。
RQ4小規模で多様なRLサブセットは、より大規模でノイズの多いRLセットでの学習より効率と品質の点で上回れるか。
RQ5Boltzmann確率とアンサンブル欠陥ベースの指標は、SLとRLの regimeでどのように振る舞うか。

主な発見

最良のSLモデルはN = 10^4サンプル時にBest-of-N Boltzmann確率が約0.55。
注意深くフィルタリングされたRLサブセットにRLを適用すると、より大きくフィルタリングされていない集合を使用する場合と比べて顕著な効率向上（約2.9xのスピードアップ）を達成。
4つのテストセットにわたり、本手法は主要指標で最先端のシステムを上回り、サンプリングが1.7x高速。
1000万のランダム誘導構造–配列ペアの大規模なSLトレーニングセットを用いると、テストデータで競争力のある性能を実現できる。
制約付きデコードは有効な設計を保証し、高スループットの構造条件付き生成を生化学的制約を保持したまま可能にする。

Figure 2: We convert a general-domain LLM into an RNA designer by keeping the pretrained transformer backbone and shrinking the input and output layers. The original embedding and LM head are downsized and reinitialized to support RNA tokens.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。