Skip to main content
QUICK REVIEW

[论文解读] Design and Analysis Strategies for Pooling in High Throughput Screening: Application to the Search for a New Anti-Microbial

Byran Smucker, Benjamin Brennan|arXiv (Cornell University)|Feb 18, 2026
Cell Image Analysis Techniques被引用 0
一句话总结

论文比较高通量筛选(HTS)中 antimicrobials 的汇聚设计与统计分析,介绍了一个 lambda 专用的 Gauss-Lasso 方法,并展示其在识别真实命中同时控制假阳性方面的应用。

ABSTRACT

A major public health issue is the growing resistance of bacteria to antibiotics. An important part of the needed response is the discovery and development of new antimicrobial strategies. These require the screening of potential new drugs, typically accomplished using high-throughput screening (HTS). Traditionally, HTS is performed by examining one compound per well, but a more efficient strategy pools multiple compounds per well. In this work, we study several recently proposed pooling construction methods, as well as a variety of pooled high-throughput screening analysis methods, in order to provide guidance to practitioners on which methods to use. This is done in the context of an application of the methods to the search for new drugs to combat bacterial infection. We discuss both an extensive pilot study as well as a small screening campaign, and highlight both the successes and challenges of the pooling approach.

研究动机与目标

  • 将 HTS 中的汇聚作为比单药筛选更高效的替代方案以寻找新抗菌药物的动机。
  • 在现实的 384 孔格式下比较三种汇聚设计策略(CRowS、MAPS、Random)。
  • 评估多种汇聚 HTS 分析方法,聚焦正则化与阈值化以识别真实命中。
  • 提出并评估一个二次筛选标准以降低假阳性及测序/验证成本。
  • 将汇聚设计应用于特定抗菌靶标(Salmonella 的 MtlD 抑制)以说明实际实施与结果。

提出的方法

  • 将汇聚 HTS 数据建模为 y = beta0 1 + X beta + epsilon,其中 X ∈ {-1,1}^{n x k} 表示晶孔中化合物的存在与否。
  • 比较三种池构造方法:Constrained Row Screening (CRowS)、Matrix-Augmented Pooling Strategy (MAPS) 与 Random Pools,使用 UE(s^2) 与相关设计准则。
  • 使用正则化回归方法估计 beta,包括 Gauss-Lasso(两阶段 Lasso 后再进行 OLS 重新拟合)、非负 Gauss-Lasso,以及带交叉验证与基于置换 p 值评估的弹性网。
  • 在 Gauss-Lasso 中引入 lambda 相关阈值化,以利用已知效应方向(抑制效应为负)并改进命中识别。
  • 加入一个二次筛选标准,要求化合物在包含它的高比例孔中实现抑制,以在降低假阳性的同时可能造成功效损失。
  • 将这些方法应用于 MtlD 抑制的试点和小规模 HTS 活动,展示汇聚如何在控制假阳性的同时识别真实命中。
a Plot of TPR and FPR, as a function of effect size and design size.
a Plot of TPR and FPR, as a function of effect size and design size.

实验结果

研究问题

  • RQ1哪种汇聚设计(CRowS、MAPS、Random)在现实 HTS 约束下提供最佳综合性能?
  • RQ2哪种分析方法(Gauss-Lasso 变体、非负 Gauss-Lasso、Elastic Net)在汇聚 HTS 中对真正阳性率与假阳性率之间提供最佳权衡?
  • RQ3lambda 专用阈值化策略是否在汇聚 HTS 中改进命中检测,相较于标准 Gauss-Lasso 或 Elastic Net?
  • RQ4二次准则是否能在保持对大效应命中的检测的同时有效降低后续验证工作量?
  • RQ5在针对 Salmonella 的 MtlD 抑制这一真实抗微生物筛选情境下,汇聚设计的表现如何?

主要发现

  • CRowS 设计在大多数模拟设置中通常表现最佳或接近最佳,在设计准则 UE(s^2) 与 MAPS 准则方面均具优势,且在灵活、统计性扎实的汇聚中更受偏好。
  • lambda 专用 Gauss-Lasso 方法在所分析的方法中实现了最佳整体对数 TPR/FPR 性能,尤其当 tau_lambda 设置为 max(beta_hat_lambda) 时。
  • Elastic Net 的 TPR 较高但 FPR 也显著更高,显示在发现与假阳性之间存在权衡,研究人员需据此权衡。
  • 非负 Gauss-Lasso 变体提供了有竞争力的性能,在效应方向已知为抑制时可能更可取。
  • 二次准则(如要求一个化合物在多个孔中显示抑制)显著降低假阳性,但以牺牲统计功效为代价,展示了实现更易于后续验证的实际路径。
  • 概念验证与小规模筛选活动表明,汇聚能够识别真实命中(对 MUT 无影响的 WT 抑制剂)并区分伪命中,假阳性率受控(在掺杂实验中约 ~0.3%)。
b Plots of log(TPR/FPR), as a function of effect size and design size.
b Plots of log(TPR/FPR), as a function of effect size and design size.

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。