[论文解读] Heterologous autoimmunity and prokaryotic immune defense
本文提出,异源自身免疫——即来自外源DNA的CRISPR间隔序列与宿主基因组发生交叉反应——作为一种选择性约束,塑造了CRISPR-Cas系统进化。通过概率建模与比较基因组学,作者表明,间隔序列长度与CRISPR间隔序列库大小可预测性地调整,以最小化自身靶向风险,且在原核生物中具有实证支持,而随机间隔序列丢失则解释了种内变异。
Some prokaryotes possess CRISPR-Cas systems that provide adaptive immunity to viruses guided by DNA segments called spacers acquired from invading phage. However, the patchy incidence and limited memory breadth of CRISPR-Cas systems suggest that their fitness benefits are offset by costs. Here, we propose that cross-reactive CRISPR targeting can lead to heterologous autoimmunity, whereby foreign spacers guide self-targeting in a spacer-length dependent fashion. Balancing antiviral defense against autoimmunity predicts a scaling relation between spacer length and CRISPR repertoire size. We find evidence for this scaling through comparative analysis of sequenced prokaryotic genomes, and show that this association also holds at the level of CRISPR types. In contrast, the scaling is absent in strains with nonfunctional CRISPR loci. Finally, we demonstrate that stochastic spacer loss can explain variations around the scaling relation, even between strains of the same species. Our results suggest that heterologous autoimmunity is a selective factor shaping the evolution of CRISPR-Cas systems.
研究动机与目标
- 探究外源间隔序列对宿主基因组的交叉反应靶向是否会造成显著的适应度成本,从而影响CRISPR-Cas系统进化。
- 确定间隔序列长度与CRISPR间隔序列库大小之间是否存在一种权衡抗病毒防御与自身免疫风险的标度关系。
- 检验该标度关系是否在非功能CRISPR位点中缺失,从而支持其作为进化适应的作用。
- 检查随机间隔序列丢失在多大程度上解释了种内预测标度关系周围间隔序列长度与间隔序列库大小的变异。
提出的方法
- 开发了一种概率模型,基于间隔序列长度、PAM存在与否及基因组长度,估算每个间隔序列发生异源自身靶向的概率。
- 使用大体数量级的估算值,针对大肠杆菌I-E型系统计算基础自身靶向风险(p0 ~10−15,对应完全匹配)。
- 将CRISPR干扰中位置和核苷酸依赖的错配耐受性纳入模型,以估算实际的交叉反应概率。
- 应用比较基因组学分析2,577种具有功能性CRISPR-Cas系统的原核生物,按间隔序列库大小分组以检验标度关系。
- 通过系统特异性参数的对数正态分布生成合成数据,模拟随机间隔序列丢失,并评估其对观测变异的影响。
- 执行线性回归与分组分析,以检验平均间隔序列长度与间隔序列库大小之间的标度定律,并按CRISPR类型进行子组分析。
实验结果
研究问题
- RQ1外源间隔序列对宿主基因组的交叉反应靶向是否在CRISPR-Cas系统中造成显著的自身免疫风险?
- RQ2是否存在一种预测的标度关系,使间隔序列长度与CRISPR间隔序列库大小协同变化,以最小化异源自身免疫风险?
- RQ3该标度关系是否在多种CRISPR-Cas类型及具有功能性系统的物种中成立,但在非功能位点中不成立?
- RQ4随机间隔序列丢失在多大程度上解释了种内预测标度关系周围间隔序列长度与间隔序列库大小的变异?
主要发现
- 在2,577种具有功能性CRISPR-Cas系统的原核生物中,观察到平均间隔序列长度与CRISPR间隔序列库大小之间存在标度关系,对数线性拟合结果为ln(N) = (1.2 ± 0.02) × ls + const.,其中N为间隔序列库大小,ls为间隔序列长度。
- 该标度关系在344种非功能CRISPR位点的物种中缺失,表明其与处于进化压力下的功能性免疫系统密切相关。
- 不同CRISPR-Cas类型的比例使用是标度关系的基础:间隔序列更长的亚型(如I型和III型)在间隔序列库较大时出现频率增加,而间隔序列较短的亚型(如II-A和II-C型)则减少。
- 通过系统特异性参数的对数正态分布建模随机间隔序列丢失,可解释标度关系周围间隔序列长度与间隔序列库大小的变异,即使在同一物种内亦成立。
- 在实际交叉反应条件下,异源自身靶向的概率估计范围为10−4至10−5,表明存在不可忽视的风险。
- 在具有功能性cas基因的物种中,基因组长度与平均间隔序列长度之间未发现显著相关性,表明间隔序列长度并非由基因组大小驱动,而是受自身免疫权衡的调控。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。