Skip to main content
QUICK REVIEW

[논문 리뷰] A dynamic programming algorithm for RNA structure prediction including pseudoknots

Elena Rivas, Sean R. Eddy|arXiv (Cornell University)|1998. 07. 27.
RNA and protein synthesis mechanisms인용 수 45
한 줄 요약

이 논문은 표준 열역학 모델 하에서 단일 RNA 서열에 대한 최적의 최소 자유 에너지 예측을 가능하게 하는, 페우드코일을 포함한 RNA 이차 구조를 예측하기 위한 동적 프로그래밍 알고리즘을 제시한다. 시간 복잡도는 O(N⁶)이고 공간 복잡도는 O(N⁴)이다. 고전적인 Zuker 알고리즘을 페우드코일을 고려하는 데 확장하기 위해 새로운 재귀적 공식화와 파이먼 다이어그램 표기법을 도입하여, 기존 방법에서 제외되는 페우드코일을 포함한 최적의 예측을 가능하게 한다.

ABSTRACT

We describe a dynamic programming algorithm for predicting optimal RNA secondary structure, including pseudoknots. The algorithm has a worst case complexity of ${\\cal O}(N^6)$ in time and ${\\cal O}(N^4)$ in storage. The description of the algorithm is complex, which led us to adopt a useful graphical representation (Feynman diagrams) borrowed from quantum field theory. We present an implementation of the algorithm that generates the optimal minimum energy structure for a single RNA sequence, using standard RNA folding thermodynamic parameters augmented by a few parameters describing the thermodynamic stability of pseudoknots. We demonstrate the properties of the algorithm by using it to predict structures for several small pseudoknotted and non-pseudoknotted RNAs. Although the time and memory demands of the algorithm are steep, we believe this is the first algorithm to be able to fold optimal (minimum energy) pseudoknotted RNAs with the accepted RNA thermodynamic model.

연구 동기 및 목표

  • 기존 방법에서 제외되는 페우드코일을 포함한 RNA 이차 구조를 예측할 수 있는 동적 프로그래밍 알고리즘을 개발하기.
  • 표준 RNA 열역학 모델을 확장하여 페우드코일 안정성에 대한 매개변수를 포함함으로써, 페우드코일을 포함한 구조에 대한 에너지 최소화를 가능하게 하기.
  • 페우드코일이 있는 RNA 접힘에 대해 엄밀하고 최적의 해를 제공함으로써 히우리스틱 또는 비최적 접근 방식의 한계를 극복하기.
  • 알고리즘의 복잡성을 관리하고 재귀적 구조 정의의 명확성을 높이기 위해 그래픽적 표현 방식(Feynman 다이어그램)을 도입하기.
  • 작은 크기의 생물학적으로 관련성이 있는 페우드코일 및 비페우드코일 RNA에 대해 알고리즘의 실현 가능성과 정확성을 입증하기.

제안 방법

  • 알고리즘은 표준 Zuker 재귀를 확장하여 페우드코일을 처리할 수 있도록 하여, RNA 서열을 중첩 및 낫기(base pair)를 포함한 부분 구조로 분할하는 재귀적 동적 프로그래밍 접근 방식을 사용한다.
  • 특정 페우드코일 구성을 갖는 부분서열의 최소 자유 에너지를 나타내기 위해 새로운 행렬 'whx'를 도입하며, 이는 일련의 재귀적 방정식으로 정의된다.
  • 알고리즘은 페우드코일 구조의 재귀적 분해를 시각적으로 표현하기 위해 파이먼 다이어그램을 활용하여, 복잡한 기저 쌍 상호작용의 수식화와 이해를 돕는다.
  • 표준 RNA 모티프(예: 스템, 헤어핀, 불러지)의 열역학적 매개변수를 포함하고, 실험 데이터로부터 유도된 특정 페우드코일 안정성 매개변수를 추가로 통합한다.
  • 모든 가능한 페우드코일 및 비페우드코일 구성에 대해 자유 에너지를 평가하고, 가장 낮은 자유 에너지를 갖는 것을 최적 예측으로 선택한다.
  • 구현은 표준 RNA 접힘 매개변수를 사용하며, 낫기 영역에서의 쌓기 및 루프 상호작용을 모델링하기 위해 경험적으로 유도된 소량의 페우드코일 매개변수를 포함한다.

실험 결과

연구 질문

  • RQ1표준 열역학 모델 하에서 열역학적으로 일관성을 유지하면서도 페우드코일을 포함한 RNA 이차 구조를 최적의 동적 프로그래밍 알고리즘으로 예측할 수 있는가?
  • RQ2이러한 알고리즘의 계산 복잡도는 얼마이며, 생물학적으로 관련성이 있는 RNA 서열에 대해 실용적으로 사용할 수 있는가?
  • RQ3페우드코일 전용 열역학적 매개변수는 예측된 구조의 안정성과 정확성에 어떤 영향을 미치는가?
  • RQ4파이먼 다이어그램의 사용이 페우드코일 RNA 접힘의 재귀적 구조를 효과적으로 표현하고 단순화할 수 있는가?
  • RQ5히우리스틱 또는 비최적 방법에 비해 이 알고리즘의 성능과 정확성은 어떻게 비교되는가?

주요 결과

  • 알고리즘은 표준 열역학 모델 하에서 페우드코일이 포함된 RNA 서열에 대해 최적의 최소 자유 에너지 예측을 달성하였으며, 이는 이 모델 하에서 이를 가능하게 하는 최초의 방법이다.
  • 최악의 경우 시간 복잡도는 O(N⁶)이고 공간 복잡도는 O(N⁴)이며, 계산적으로 매우 비용이 많이 들지만 문제에 대해 이론적으로 최적이다.
  • 식물 바이러스 RNA 및 RNase P에서 알려진 페우드코일 구조를 성공적으로 예측하여 생물학적 관련성을 입증하였다.
  • 페우드코일 전용 열역학적 매개변수를 포함시킴으로써, 낫기 상호작용을 배제한 모델에 비해 예측된 구조의 정확도가 크게 향상되었다.
  • 파이먼 다이어그램의 사용은 재귀적 구조를 명확하고 체계적으로 표현할 수 있게 하여, 알고리즘의 유도 및 구현을 용이하게 하였다.
  • 알고리즘이 비록 계산 비용이 높지만 최적의 페우드코일 예측이 가능하다는 것을 입증하였으며, 향후 히우리스틱 접근 방식의 기준이 되는 벤치마크를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.