Skip to main content
QUICK REVIEW

[논문 리뷰] BPPart and BPMax: RNA-RNA Interaction Partition Function and Structure Prediction for the Base Pair Counting Model

Ali Ebrahimpour-Boroojeny, Sanjay Rajopadhye|arXiv (Cornell University)|2019. 04. 02.
RNA and protein synthesis mechanisms참고 문헌 53인용 수 2
한 줄 요약

이 논문은 복잡한 열역학적 모델링 대신 가중치가 부여된 기초 쌍 수를 사용하는 경량 RNA-RNA 상호작용 예측 도구인 BPPart와 BPMax를 소개한다. 각각 piRNA 알고리즘 대비 225배 및 1350배 빠른 속도 향상을 달성했으며, 50,500개의 실험적으로 검증된 RRIs에서 piRNA와 높은 상관관계(0.855–0.920)를 유지한다. 이는 파킨슨병 및 카다실리아와 같은 질병 연관 RNA 상호작용, 예를 들어 SNORD3D와 TRAF3의 효율적 필터링을 가능하게 한다.

ABSTRACT

A few classes of RNA-RNA interaction (RRI) with complex roles in cellular functions, such as miRNA-target and lncRNAs, have already been studied. Accordingly, RRI bioinformatics tools proposed in the last decade are tailored for those specific classes. Interestingly, there are somewhat unnoticed mRNA-mRNA interactions in the literature with potentially drastic biological roles. Hence, there is a need for high-throughput generic RRI bioinformatics tools that can be used in more comprehensive settings. In this work, we revisit two of the RRI partition function algorithms, piRNA and rip. These are equivalent methods that implement the most comprehensive and computationally intensive thermodynamic model for RRI. We propose simpler models that are shown to retain the vast majority of the thermodynamic information that the more complex models capture. Specifically, we simplify the energy model by ignoring the system’s entropy and show its equivalency to a base-pair counting model. We allow different weights for base-pairs to maximize the correlations with the full thermodynamic model. Our newly developed algorithm, BPPart, is 225× faster than piRNA and is more expressive and easier to analyze due to its simplicity and order of magnitude reduction in the number of dynamic programming tables. Still, based on our analysis of both the real and randomly generated data, its scores achieve a correlation of 0.855 with piRNA at 37^{∘}C. Finally, we illustrate one use-case of such simpler models to generate hypotheses about the roles of specific RNAs in various diseases. We have made our tool publicly available and believe that this faster and more expressive model will make the incorporation of physics-guided information in complex RRI analysis and prediction models more accessible.

연구 동기 및 목표

  • 다양한 RNA 종류, 특히 연구가 부족한 mRNA-mRNA 상호작용을 포함한 고속 스케일링 가능한 RNA-RNA 상호작용(RRI) 예측 도구 개발을 위한 목표.
  • piRNA 알고리즘의 복잡한 Turner 에너지 모델을 단순화하여 기초 쌍 수 계산에 집중함으로써 계산 및 메모리 오버헤드를 줄이는 것.
  • 이 단순화가 생물학적으로 의미 있는 예측을 위한 충분한 열역학 정보를 유지하는지 평가하는 것.
  • 새로운 도구를 사용하여 신규로 질병 연관 RNA 상호작용을 규명하는 것, 특히 신경퇴행성 장애에서의 응용에 중점을 두고.
  • 미래의 기계학습 통합을 위한 RRI 예측 파이프라인에서 사용 가능한 확장 가능하고 모듈식 프레임워크 제공

제안 방법

  • 기초 쌍 확률을 계산하기 위해 아홉 개인 4차원 동적 프rogramming 테이블을 사용하는 BPPart라는 기초 쌍 분할 함수 알고리즘 제안.
  • 가장 안정적인 RRI 구조를 예측하기 위해 단일 4차원 DP 테이블을 사용하는 BPMax라는 기초 쌍 최대화 알고리즘 개발.
  • 전체 Turner 에너지 모델을 간단화된 가중 기초 쌍 수 계산 방식으로 대체하여, CG(3), AU(1), GU(2) 쌍에 고정된 에너지를 할당.
  • piRNA 결과와의 상관관계를 극대화하기 위해 온도별(예: −180°C 및 37°C) 기초 쌍 가중치를 최적화.
  • piRNA의 96개 테이블 대비 테이블 수를 줄이고 액세스 횟수를 감소시켜 시간 및 메모리 복잡도를 크게 낮춘 구현.
  • BPPart를 사용해 질병 연관 돌연변이에서의 이질적 상호작용 점수를 탐지하고, TRAF3 및 SNORD3D에서 기능적 영향을 유도할 수 있는 잠재적 영향을 식별.

실험 결과

연구 질문

  • RQ1완전한 Turner 모델 대비 단순화된 기초 쌍 수 계산 모델이 정확한 RNA-RNA 상호작용 예측을 위해 충분한 열역학 정보를 유지할 수 있는가?
  • RQ2BPPart와 BPMax의 계산 성능 및 정확도가 다양한 RNA 유형과 온도에서 최신 기술인 piRNA 알고리즘과 비교해 어떻게 되는가?
  • RQ3BPPart는 기초 메커니즘이 완전히 규명되지 않은 경우에도 질병 연관 돌연변이와 관련된 생물학적으로 의미 있는 RNA 상호작용을 탐지할 수 있는가?
  • RQ4온도가 단순화된 모델과 전체 열역학 모델 간의 상관관계에 어떤 영향을 미치며, 이를 모델 校정에 어떻게 활용할 수 있는가?
  • RQ5BPPart는 다단계 RRI 예측 파이프라인에서 기계학습과 결합할 경우 빠르고 정확한 필터링 단계로 활용될 수 있는가?

주요 결과

  • BPPart는 50,500개의 실험적으로 특성화된 RRIs에서 37°C에서 piRNA와 피어슨 상관계수 0.855, 스피어만 순위 상관계수 0.836를 기록한다.
  • −180°C에서 BPPart의 piRNA와의 상관계수는 피어슨 기준 0.920, 스피어만 기준 0.904로 상승하여 열역학적 순위 유지가 뚜렷하게 확인된다.
  • BPMax는 piRNA 대비 1350배 더 빠르며, 37°C에서 piRNA와 피어슨 상관계수 0.836, 스피어만 상관계수 0.808을 유지한다.
  • BPPart는 TRAF3와 SNORD3D를 질병 연관 RNA로 식별하였으며, 이들의 상호작용 영역에서 병적 돌연변이가 심각한 점수 이질성을 유도함을 확인했다.
  • 단순화된 모델은 메모리 사용량을 줄여 향후 GPU와 같은 하드웨어 가속기에서의 최적화를 가능하게 한다.
  • 본 연구는 기초 쌍 수 계산이 열역학 정보의 상당 부분을 포괄함을 입증하여, 확장 가능한 물리 기반 RRI 예측 파이프라인에 적합한 것으로 나타났다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.