Skip to main content
QUICK REVIEW

[論文レビュー] BPPart and BPMax: RNA-RNA Interaction Partition Function and Structure Prediction for the Base Pair Counting Model

Ali Ebrahimpour-Boroojeny, Sanjay Rajopadhye|arXiv (Cornell University)|Apr 2, 2019
RNA and protein synthesis mechanisms参考文献 53被引用数 2
ひとこと要約

本論文は、複雑な熱力学的モデルに代えて重み付き塩基対数え上げを用いる、軽量なRNA-RNA相互作用予測ツールBPPartおよびBPMaxを紹介する。それぞれpiRNAアルゴリズムに対して225倍および1350倍の高速化を達成し、50,500件の実験的に検証済みRRIsにおいてpiRNAと高い相関(0.855–0.920)を維持している。これにより、パーキンソン病やCADASILにおけるSNORD3DおよびTRAF3など、疾患関連RNA相互作用の効率的なスクリーニングが可能になる。

ABSTRACT

A few classes of RNA-RNA interaction (RRI) with complex roles in cellular functions, such as miRNA-target and lncRNAs, have already been studied. Accordingly, RRI bioinformatics tools proposed in the last decade are tailored for those specific classes. Interestingly, there are somewhat unnoticed mRNA-mRNA interactions in the literature with potentially drastic biological roles. Hence, there is a need for high-throughput generic RRI bioinformatics tools that can be used in more comprehensive settings. In this work, we revisit two of the RRI partition function algorithms, piRNA and rip. These are equivalent methods that implement the most comprehensive and computationally intensive thermodynamic model for RRI. We propose simpler models that are shown to retain the vast majority of the thermodynamic information that the more complex models capture. Specifically, we simplify the energy model by ignoring the system’s entropy and show its equivalency to a base-pair counting model. We allow different weights for base-pairs to maximize the correlations with the full thermodynamic model. Our newly developed algorithm, BPPart, is 225× faster than piRNA and is more expressive and easier to analyze due to its simplicity and order of magnitude reduction in the number of dynamic programming tables. Still, based on our analysis of both the real and randomly generated data, its scores achieve a correlation of 0.855 with piRNA at 37^{∘}C. Finally, we illustrate one use-case of such simpler models to generate hypotheses about the roles of specific RNAs in various diseases. We have made our tool publicly available and believe that this faster and more expressive model will make the incorporation of physics-guided information in complex RRI analysis and prediction models more accessible.

研究の動機と目的

  • 多様なRNAクラス、特に未解明のmRNA-mRNA相互作用を含む、高スループットな解析に適した、より高速でスケーラブルなRNA-RNA相互作用(RRI)予測ツールの開発。
  • piRNAアルゴリズムにおける複雑なターナーエネルギーモデルを、重み付き塩基対数え上げに焦点を当てることで単純化し、計算およびメモリのオーバーヘッドを低減すること。
  • この単純化が生物学的に意味のある予測に十分な熱力学的情報を保持しているかどうかの評価。
  • 新規のツールを用いて、神経変性疾患を中心に、疾患関連RNA相互作用の同定。
  • 将来の機械学習統合を想定した、スケーラブルでモジュラーなRRI予測パイプラインフレームワークの提供。

提案手法

  • 9つの4次元動的計画法テーブルを用いて塩基対確率を計算する、BPPartと呼ばれる塩基対分割関数アルゴリズムの提案。
  • 1つの4次元DPテーブルを用いて最も安定したRRI構造を予測する、BPMaxと呼ばれる塩基対最大化アルゴリズムの開発。
  • 完全なターナーエネルギーモデルを、CG(3)、AU(1)、GU(2)ペアに固定エネルギーを割り当てる単純化された重み付き塩基対数え上げスキームに置き換え。
  • piRNAの結果との相関を最大化するように、異なる温度(例:−180°Cおよび37°C)における塩基対の重みを最適化。
  • piRNAの96テーブルよりも大幅にテーブル数を削減し、参照回数も減らした実装により、時間的およびメモリ的複雑度を顕著に低減。
  • BPPartを用いて疾患関連突然変異における外れ値スコアを検出。TRAF3およびSNORD3Dにおける機能的影響を同定。

実験結果

リサーチクエスチョン

  • RQ1完全なターナーモデルと比較して、単純化された塩基対数え上げモデルが、正確なRNA-RNA相互作用予測に十分な熱力学的情報を保持できるか。
  • RQ2BPPartおよびBPMaxの計算パフォーマンスと正確性は、多様なRNAタイプおよび温度条件下で、最先端のpiRNAアルゴリズムと比較してどの程度か。
  • RQ3BPPartは、メカニズムが完全に解明されていない場合でも、疾患関連突然変異と関連する生物学的に有意なRNA相互作用を検出できるか。
  • RQ4温度が単純化モデルと完全な熱力学モデルとの相関にどの程度影響を与えるか。また、この影響はモデルキャリブレーションにどのように活用できるか。
  • RQ5BPPartは、特に機械学習と組み合わせた場合に、マルチステージRRI予測パイプラインにおける高速かつ正確なスクリーニングステップとして機能できるか。

主な発見

  • BPPartは、50,500件の実験的に特徴付けられたRRIsにおいて37°CでpiRNAとのピアソン相関係数0.855、スピアマン順位相関係数0.836を達成。
  • −180°Cでは、BPPartのpiRNAとの相関はピアソンで0.920、スピアマンで0.904に上昇し、熱力学的順位付けの強力な保存が示された。
  • BPMaxはpiRNAよりも1350倍高速であり、37°CでpiRNAとのピアソン相関係数0.836、スピアマン相関係数0.808を維持。
  • BPPartはTRAF3およびSNORD3Dを疾患関連RNAとして同定し、それらの相互作用領域における病原性突然変異が顕著なスコア外れ値を引き起こしていることを特定。
  • 単純化されたモデルはメモリ使用量を削減し、将来的にGPUなどのハードウェアアクセラレータでの最適化を可能にする。
  • 本研究では、塩基対数え上げが熱力学的情報の大部分を捉えられることを示し、スケーラブルで物理的根拠に基づくRRI予測パイプラインに適していることが明らかになった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。