QUICK REVIEW

[论文解读] Physically-Inspired Gaussian Process Models for Post-Transcriptional Regulation in Drosophila

Andrés F. López-Lopera, Nicolas Durrande|arXiv (Cornell University)|Aug 29, 2018

Neurobiology and Insect Physiology Research参考文献 49被引用 11

一句话总结

该论文提出了两种新颖的、基于物理机制的高斯过程模型，用于果蝇（Drosophila melanogaster）的转录后调控，利用反应-扩散方程将mRNA与间隙蛋白动力学联系起来。这些模型通过核函数直接编码时空动态，无需空间离散化，从而能够从mRNA数据中实现精确且带有不确定性估计的蛋白质表达预测；其中一种模型（GP-mRNA）在均匀边界条件下表现更优，另一种模型（GP-Protein）则通过核函数的导数运算实现高效计算。

ABSTRACT

The regulatory process of Drosophila is thoroughly studied for understanding a great variety of biological principles. While pattern-forming gene networks are analysed in the transcription step, post-transcriptional events (e.g. translation, protein processing) play an important role in establishing protein expression patterns and levels. Since the post-transcriptional regulation of Drosophila depends on spatiotemporal interactions between mRNAs and gap proteins, proper physically-inspired stochastic models are required to study the link between both quantities. Previous research attempts have shown that using Gaussian processes (GPs) and differential equations lead to promising predictions when analysing regulatory networks. Here we aim at further investigating two types of physically-inspired GP models based on a reaction-diffusion equation where the main difference lies in where the prior is placed. While one of them has been studied previously using protein data only, the other is novel and yields a simple approach requiring only the differentiation of kernel functions. In contrast to other stochastic frameworks, discretising the spatial space is not required here. Both GP models are tested under different conditions depending on the availability of gap gene mRNA expression data. Finally, their performances are assessed on a high-resolution dataset describing the blastoderm stage of the early embryo of Drosophila melanogaster

研究动机与目标

开发基于物理机制的高斯过程模型，通过将反应-扩散动力学整合到随机框架中，精确捕捉果蝇中的转录后调控。
通过利用高斯过程先验，从蛋白质测量中推断mRNA动力学，以应对实验mRNA数据有限的挑战。
消除时空建模中对空间离散化的依赖，保持分辨率并提升计算效率。
比较两种高斯过程框架——基于先验在反应-扩散系统中位置的GP-mRNA与GP-Protein，评估其在不同数据可得性条件下的预测性能。
提供一种可扩展、可微分的框架，用于利用高分辨率囊胚期数据建模早期果蝇胚胎中的时空蛋白质表达模式。

提出的方法

将反应-扩散偏微分方程（PDE）作为建模果蝇中mRNA与蛋白质动力学的机制核心。
对mRNA（GP-mRNA）或蛋白质（GP-Protein）场施加高斯过程先验，将物理约束直接嵌入核函数结构。
通过对方差-指数（SE）核函数关于空间与时间变量求导，推导出GP协方差与交叉协方差函数的闭式表达式。
利用格林函数方法，将PDE的解表示为驱动源（mRNA）的函数，从而实现对蛋白质浓度的高斯过程结果的解析计算。
通过利用PDE解的解析结构，避免空间离散化，保持高分辨率的时空预测能力。
通过核函数导数计算mRNA或蛋白质场的先验分布，无需数值求解PDE，从而实现通过标准高斯过程回归进行高效推理。

实验结果

研究问题

RQ1如何在不依赖空间离散化的情况下，利用基于物理机制的高斯过程建模果蝇中的转录后调控？
RQ2在反应-扩散框架中，将高斯过程先验置于mRNA（GP-mRNA）与蛋白质（GP-Protein）上，各自具有哪些相对优势？
RQ3核函数微分技术是否能够实现PDE模型中高斯过程先验的高效、闭式计算，从而避免数值积分或求解？
RQ4当仅有蛋白质数据或同时拥有mRNA与蛋白质数据时，两种GP模型在预测间隙蛋白表达模式方面的表现如何？
RQ5在何种条件（如初始/边界条件）下，GP-mRNA优于GP-Protein，反之亦然？

主要发现

在均匀初始与边界条件（如零条件）下，将先验置于mRNA上的GP-mRNA模型表现优于GP-Protein，原因在于核函数结构中显式编码了这些约束。
GP-Protein模型通过直接对核函数求导实现高效计算，避免了解PDE或计算多重积分，因而具有良好的计算可扩展性。
两种模型均在高分辨率囊胚期数据集上实现了对间隙蛋白表达模式（Kr, Kni, Gt）的高保真预测，当mRNA数据可用时，GP-mRNA表现出更低的预测误差。
该框架在无需空间离散化的情况下成功捕捉了蛋白质浓度梯度的时空动态，保持了分辨率并减少了近似误差。
该框架能够对mRNA与蛋白质浓度提供不确定性量化，即使在观测稀疏的情况下也能生成预测的置信区间。
GP-Protein模型可扩展至多输入、多输出场景（如多个mRNA与蛋白质），表明其在复杂调控网络中具有更广泛的应用潜力。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。