[论文解读] How essential are unstructured clinical narratives and information fusion to clinical trial recruitment?
本研究证明,非结构化临床叙述和信息融合对于准确确定临床试验中患者资格至关重要,尤其是在慢性淋巴细胞白血病(CLL)和前列腺癌中。通过在结构化和非结构化电子健康记录(EHR)数据中应用自然语言处理和时间推理,作者发现59%的CLL和77%的前列腺癌试验资格标准需要来自临床叙述的信息,表明仅靠结构化数据不足以实现有效的患者招募。
Electronic health records capture patient information using structured controlled vocabularies and unstructured narrative text. While structured data typically encodes lab values, encounters and medication lists, unstructured data captures the physician's interpretation of the patient's condition, prognosis, and response to therapeutic intervention. In this paper, we demonstrate that information extraction from unstructured clinical narratives is essential to most clinical applications. We perform an empirical study to validate the argument and show that structured data alone is insufficient in resolving eligibility criteria for recruiting patients onto clinical trials for chronic lymphocytic leukemia (CLL) and prostate cancer. Unstructured data is essential to solving 59% of the CLL trial criteria and 77% of the prostate cancer trial criteria. More specifically, for resolving eligibility criteria with temporal constraints, we show the need for temporal reasoning and information integration with medical events within and across unstructured clinical narratives and structured data.
研究动机与目标
- 评估非结构化临床叙述在解决临床试验资格标准中的必要性。
- 评估仅使用结构化数据是否足以解决资格标准,或是否需要与叙述文本进行信息融合。
- 研究时间推理在跨EHR数据源解释资格约束中的作用。
- 量化依赖从临床叙述中提取信息的资格标准比例,与依赖结构化数据的比例进行比较。
- 证明仅依赖结构化EHR数据在肿瘤学试验中患者招募方面的局限性。
提出的方法
- 使用CLL和前列腺癌患者的现实世界EHR数据进行实证研究。
- 从两种疾病的临床试验方案中提取并分析资格标准。
- 应用自然语言处理(NLP)技术,从非结构化叙述笔记中提取临床相关信息。
- 通过信息融合,将非结构化叙述的发现与结构化数据(如实验室值、药物)整合。
- 执行时间推理,以解决疾病持续时间、既往治疗和反应时间线等时间依赖性标准。
- 量化解决资格标准所需叙述数据的比例,并比较仅使用结构化数据与融合数据方法的差异。
实验结果
研究问题
- RQ1非结构化临床叙述在解决临床试验资格标准方面贡献程度如何?
- RQ2仅使用结构化EHR数据是否足以解决临床试验资格标准,还是与叙述文本的信息融合至关重要?
- RQ3时间推理在跨临床数据源解释资格约束方面有多关键?
- RQ4CLL和前列腺癌试验中,有多少比例的资格标准依赖于从临床叙述中提取的信息?
- RQ5结构化与非结构化数据之间的信息融合在哪些方面提升了患者招募的准确性?
主要发现
- 在慢性淋巴细胞白血病(CLL)试验中,非结构化临床叙述对于解决59%的资格标准至关重要。
- 在前列腺癌试验中,77%的资格标准需要来自非结构化叙述的信息才能被解决。
- 仅靠结构化数据无法解决大多数资格标准,特别是涉及临床判断、预后或治疗反应的标准。
- 在叙述和结构化数据之间进行时间推理,对于解决疾病持续时间、治疗史等时间依赖性约束至关重要。
- 将非结构化叙述与结构化数据进行信息融合,显著提高了患者资格判定的完整性和准确性。
- 本研究证明,仅依赖结构化数据会导致大量患者招募不足,因为临床笔记中遗漏了关键的资格信息。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。