[论文解读] Model-based Prediction and Optimal Control of Pandemics by Non-pharmaceutical Interventions
本文提出了一种基于模型的信号处理框架,结合有限时域最优控制与扩展卡尔曼滤波,用于预测大流行趋势并在区域和国家层面制定最优非药物干预(NPI)措施。该框架通过动态加权NPI,平衡人类健康结果(如新增病例、死亡人数)与干预成本,利用校准后的分 compartment 模型(基于牛津新冠政府应对追踪器的真实世界数据)实现帕累托最优的NPI策略。
A model-based signal processing framework is proposed for pandemic trend forecasting and control, by using non-pharmaceutical interventions (NPI) at regional and country levels worldwide. The control objective is to prescribe quantifiable NPI strategies at different levels of stringency, which balance between human factors (such as new cases and death rates) and cost of intervention per region/country. Due to infrastructural disparities and differences in priorities of regions and countries, strategists are given the flexibility to weight between different NPIs and to select the desired balance between the human factor and overall NPI cost. The proposed framework is based on a extit{finite-horizon optimal control} (FHOC) formulation of the bi-objective problem and the FHOC is numerically solved by using an ad hoc extit{extended Kalman filtering/smoothing} framework for optimal NPI estimation and pandemic trend forecasting. The algorithm enables strategists to select the desired balance between the human factor and NPI cost with a set of weights and parameters. The parameters of the model are partially selected by epidemiological facts from COVID-19 studies, and partially trained by using machine learning techniques. The developed algorithm is applied on ground truth data from the Oxford COVID-19 Government Response Tracker project, which has categorized and quantified the regional responses to the pandemic for more than 300 countries and regions worldwide, since January 2020. The dataset was used for NPI-based prediction and prescription during the XPRIZE Pandemic Response Challenge.
研究动机与目标
- 开发一种灵活的、基于模型的框架,用于在区域和国家层面预测大流行趋势并制定非药物干预(NPI)措施。
- 通过加权多目标优化,解决最小化人类影响(新增病例、死亡人数)与最小化NPI的经济和社会成本之间的权衡。
- 通过调整NPI权重,使政策制定者能够选择反映本地基础设施、经济状况和优先事项差异的干预策略。
- 通过利用观测数据、模型估计与最优控制,构建一个闭环系统,实现实时大流行控制。
- 在XPRIZE大流行应对挑战赛期间,利用牛津新冠政府应对追踪器的真实数据验证该框架。
提出的方法
- 该框架采用有限时域最优控制(FHOC)公式求解一个双目标优化问题,以平衡人类健康因素与NPI成本。
- 采用扩展卡尔曼滤波(EKF)与平滑器(EKS),在离散时间非线性分 compartment 模型中联合估计状态与参数。
- 动态模型基于改进的SIR型系统,包含易感者、感染者状态变量,以及受NPI影响的时变接触率α,通过函数h(uk)实现。
- NPI到接触率的映射函数h(uk)部分基于流行病学数据,部分通过机器学习技术训练得到。
- 观测模型使用报告的病例数(新增或累计)并加入加性测量噪声,EKF应用时施加硬约束以保持状态的物理合理性。
- 算法通过连续动力学的离散时间近似实现,EKF更新采用基于雅可比矩阵的线性化。
实验结果
研究问题
- RQ1基于模型的信号处理框架如何在大流行期间最优地平衡人类健康结果与干预成本?
- RQ2不同NPI对大流行传播的影响如何?其有效性如何在基础设施各异的地区之间量化与比较?
- RQ3采用动态加权的有限时域最优控制方法能否生成反映现实政策权衡的帕累托最优NPI策略?
- RQ4混合EKF/EKS框架在使用具有噪声的真实世界NPI与病例数据时,能否准确估计隐藏的大流行状态与模型参数?
- RQ5通过机器学习增强的NPI到接触率函数的参数化,能在多大程度上提升预测与控制性能?
主要发现
- 所提出的框架成功制定了在新增病例与干预成本之间实现平衡的帕累托最优NPI策略,其有效性在分 compartment 模型精度范围内得到验证。
- EKF/EKS估计框架实现了对状态与参数的精确跟踪,从而支持可靠的趋势预测与NPI制定。
- 得益于滤波与硬约束实施步骤,该模型在处理具有测量噪声与不确定性的现实世界数据时表现出强鲁棒性。
- 将流行病学先验知识与机器学习相结合,用于NPI到接触率函数h(uk)的构建,显著提升了模型的适应性与预测性能。
- 该框架已成功应用于牛津新冠政府应对追踪器提供的300多个国家与地区的数据,证明了其可扩展性与现实适用性。
- 该算法的软件实现已公开发布,支持可复现性与进一步研究。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。