Skip to main content
QUICK REVIEW

[论文解读] SISRS: SNP Identification from Short Read Sequences

Rachel S. Schwartz, Kelly M. Harkins|arXiv (Cornell University)|May 16, 2013
Genomics and Phylogenetic Studies被引用 9
一句话总结

SISRS 是一种新颖的无参考基因组方法,通过跳过从头组装和比对步骤,直接从短读长测序数据中快速识别具有系统发育信息的SNP。该方法在灵长类和胎盘哺乳动物中利用数千个可变位点实现了准确的系统发育重建,无需参考基因组,展现出高效率和高准确性。

ABSTRACT

We have developed a novel method to rapidly obtain homologous genomic data for phylogenetics directly from next-generation sequencing reads without the use of a reference genome. This software, called SISRS, avoids the time consuming steps of de novo whole genome assembly, genome-genome alignment, and annotation. For simulations SISRS is able to identify large numbers of loci containing variable sites with phylogenetic signal. For genomic data from apes, SISRS identified thousands of variable sites, from which we produced an accurate phylogeny. Finally, we used SISRS to identify phylogenetic markers that we used to estimate the phylogeny of placental mammals. We recovered phylogenies from multiple datasets that were consistent with previous conflicting estimates of the relationships among mammals. SISRS is open source and freely available at this https URL.

研究动机与目标

  • 开发一种跳过参考基因组以及从头组装和基因组比对等耗时步骤的系统发育分析方法。
  • 直接从下一代测序读长中识别具有系统发育信号的同源基因组位点。
  • 仅使用短读长数据实现准确的物种树估计,尤其适用于非模式生物。
  • 为多样分类群的SNP发现和系统发育重建提供可扩展、开源的解决方案。

提出的方法

  • SISRS 采用无参考基因组的方法,通过聚类和比对读长,在多个短读长数据集中识别同源位点,无需参考基因组。
  • 采用基于k-mer的策略检测样本间共享的基因组区域,实现在无需从头组装的情况下识别基因座。
  • 从比对的读长中提取可变位点,聚焦于具有系统发育信号的位点以供后续分析。
  • 利用读长聚类和迭代比对,即使在复杂或高度分化的基因组区域也能解析同源基因座。
  • SISRS 使用识别出的SNP,通过标准系统发育推断方法构建系统发育树。

实验结果

研究问题

  • RQ1是否能够直接从短读长数据中实现SNP识别和系统发育重建,而无需参考基因组?
  • RQ2SISRS 仅使用测序读长,能否准确恢复灵长类中已知的系统发育关系?
  • RQ3SISRS 能否通过从头SNP发现解决胎盘哺乳动物系统发育中长期存在的争议?
  • RQ4在复杂基因组数据集中,SISRS 与基于参考基因组的方法相比,在效率和准确性方面表现如何?

主要发现

  • SISRS 在灵长类基因组数据中成功识别出数千个具有系统发育信号的可变位点,实现了准确的系统发育重建。
  • 该方法在多个数据集中均产生了稳定且准确的系统发育树,解决了胎盘哺乳动物关系中先前存在冲突的估计。
  • SISRS 通过避免计算密集型步骤(如从头组装和全基因组比对)展现出高效率。
  • 该软件为开源并可免费获取,可在非模式生物和无参考基因组系统发育分析中广泛应用。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。