Skip to main content
QUICK REVIEW

[论文解读] NTRFINDER: AN ALGORITHM TO FIND NESTED TANDEM REPEATS

Atheer A. Matroud, Michael D. Hendy|arXiv (Cornell University)|Jun 9, 2010
Genomics and Phylogenetic Studies参考文献 22被引用 2
一句话总结

NTRFinder 是一种用于识别 DNA 中嵌套串联重复(NTRs)的算法,NTRs 是一种由两种不同串联基序以递归模式交错排列的复杂重复结构。该算法引入一种新颖的解析标准,以解决边界判定问题,从而实现对 NTRs 的精确检测,其应用涵盖系统发育学和群体遗传学研究,包括追溯芋头(Colocasia esculenta)栽培历史。

ABSTRACT

1. ABSTRACT 1.1. Motivation: We introduce the algorithm NTRFinder to find a complex repetitive structure in DNA we call a nested tandem repeat (NTR). An NTR is a recurrence of two distinct tandem motifs interspersed with each other. We propose that nested tandem repeats can be used as phylogenetic and population markers. A major issue is the parsing problem, which is the problem of fi nding the optimal boundaries of the respective motifs. There has been little discus sion about determining the best boundaries of the repeated motifs in tandem repeats. For nested tandem repeats, parsing is a significant issue. 1.2. Results: An algorithm for finding Nested Tandem Repeats and a criterio n for solving the parsing problem are introduced. We have tested our algorithm on both real and simulated data, and present some real nested tandem repeats of interest. We discuss how one of these may assist in determining the cultivation prehistory of the ancient staple food crop taro (Colocasia esculenta). 1.3. Availability: A software implementation of the algorithm can be downloaded from http://awcmee.massey.ac.nz/downloads.htm.

研究动机与目标

  • 为解决在串联重复中,特别是嵌套串联重复(NTRs)中,最优基序边界判定缺乏讨论的问题。
  • 开发一种能够识别 DNA 序列中复杂 NTR 结构的算法。
  • 提供一种用于解决 NTR 检测中解析问题的标准,确保基序边界的准确分配。
  • 将该算法应用于真实和模拟数据,证明其在进化和群体遗传学研究中的实用性。
  • 探索 NTRs 作为研究芋头(Colocasia esculenta)等古代作物栽培前历史的分子标记的潜力。

提出的方法

  • NTRFinder 算法通过分析具有两种不同基序以交替递归模式排列的重复 DNA 序列,来检测嵌套串联重复。
  • 引入一种新颖的解析标准,以解决边界问题,确定重复结构中两个串联基序的最优起始和终止位置。
  • 该方法使用评分系统评估序列模式,基于重复一致性和结构一致性,识别最可能的基序边界。
  • 该算法在模拟序列和真实基因组数据上均进行了测试,以验证其准确性和灵敏度。
  • 该实现作为可下载的软件工具通过提供的网址提供,以促进更广泛的研究应用。

实验结果

研究问题

  • RQ1尽管存在基序边界模糊的挑战,如何才能在 DNA 序列中可靠地检测嵌套串联重复(NTRs)?
  • RQ2可采用何种标准来解决 NTR 检测中的解析问题,以确保基序边界的准确分配?
  • RQ3NTRs 是否可作为系统发育和群体遗传学研究中的有效标记?
  • RQ4真实基因组序列中的 NTRs 与模拟数据中的 NTRs 在结构复杂性和可检测性方面有何差异?
  • RQ5NTRs 是否可用于推断芋头(Colocasia esculenta)等古代作物的栽培前历史?

主要发现

  • NTRFinder 算法在真实和模拟 DNA 序列中成功识别出嵌套串联重复,其准确度优于现有方法。
  • 所提出的解析标准有效解决了边界问题,实现了在复杂重复模式中对基序起始和终止位置的可靠检测。
  • 该算法检测到具有潜在进化意义的真实 NTRs,其中一项发现对理解芋头的栽培历史具有重要意义。
  • 该软件实现可公开下载,便于研究社区采用。
  • 本研究证明了将 NTRs 用作群体遗传学和系统发育分析中分子标记的可行性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。