Skip to main content
QUICK REVIEW

[论文解读] Bidirectional LSTM-CRF for Clinical Concept Extraction

Raghavendra Chalapathy, Ehsan Zare Borzeshi|arXiv (Cornell University)|Oct 19, 2016
Topic Modeling参考文献 22被引用 46
一句话总结

该论文提出了一种基于预训练词嵌入(GloVe 和 Word2Vec)的双向LSTM-CRF模型,用于临床概念抽取,无需人工特征工程。该方法在2010年i2b2/VA基准测试中达到最先进性能,微F1分数为83.81%,排名第二,展现出优异的泛化能力及对未登录词的鲁棒性。

ABSTRACT

Extraction of concepts present in patient clinical records is an essential step in clinical research. The 2010 i2b2/VA Workshop on Natural Language Processing Challenges for clinical records presented concept extraction (CE) task, with aim to identify concepts (such as treatments, tests, problems) and classify them into predefined categories. State-of-the-art CE approaches heavily rely on hand crafted features and domain specific resources which are hard to collect and tune. For this reason, this paper employs bidirectional LSTM with CRF decoding initialized with general purpose off-the-shelf word embeddings for CE. The experimental results achieved on 2010 i2b2/VA reference standard corpora using bidirectional LSTM CRF ranks closely with top ranked systems.

研究动机与目标

  • 为解决在非结构化患者记录中进行临床概念抽取的挑战,避免依赖耗时的领域特定特征工程。
  • 评估端到端深度学习结合预训练词嵌入是否能够匹配或超越传统监督模型在临床NLP中的表现。
  • 证明使用通用嵌入的双向LSTM-CRF可在2010年i2b2/VA临床概念抽取任务中实现具有竞争力的性能。
  • 探索使用现成嵌入进行临床NLP任务的可行性,降低对领域特定预训练或专家标注的依赖。

提出的方法

  • 使用双向长短期记忆网络(LSTM)对临床文本序列的上下文表示进行编码。
  • 在LSTM之上添加条件随机场(CRF)层,以建模标签依赖关系并执行序列标注。
  • 使用来自通用领域语料库(如维基百科)的预训练GloVe和Word2Vec嵌入初始化词嵌入,而非领域特定的嵌入。
  • 通过基于验证性能的早停策略,使用反向传播端到端训练整个模型。
  • 通过在训练期间随机初始化未登录词(如缩写、字母数字串)的嵌入来处理未登录词。
  • 通过在验证集上进行网格搜索,优化超参数(隐藏单元数、嵌入维度、学习率、Dropout率)。

实验结果

研究问题

  • RQ1使用现成词嵌入的双向LSTM-CRF模型是否能在无需人工特征工程的情况下,实现临床概念抽取的竞争力表现?
  • RQ2与依赖大量特征工程和领域特定资源的最先进系统相比,深度学习方法的性能如何?
  • RQ3预训练的通用嵌入在多大程度上能泛化到临床文本,特别是对罕见或缩写术语?
  • RQ4模型的端到端学习能力是否提升了对未登录词和非正式临床表达的鲁棒性?

主要发现

  • 该双向LSTM-CRF模型在2010年i2b2/VA测试集上取得了83.81%的微F1分数,是挑战中所有系统中的第二名。
  • 该模型优于多个基于规则和词典依赖的系统,即使未使用领域特定特征,也展现出强大的泛化能力。
  • 当约20%的词为未登录词时,系统仍能保持高性能,这些未登录词虽被随机初始化,但仍能学习到有意义的表示。
  • 该模型的性能与依赖复杂无监督特征学习的最先进半监督马尔可夫HMM系统相当。
  • 该方法消除了对大量特征工程的需求,显著降低了开发工作量,同时保持了高精度。
  • 结果表明,来自通用领域语料库的预训练嵌入可作为临床NLP任务的有效初始化,尤其在与深度序列建模结合时。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。