QUICK REVIEW

[論文レビュー] A Neural Topic-Attention Model for Medical Term Abbreviation Disambiguation

Irene Li, Michihiro Yasunaga|arXiv (Cornell University)|Oct 30, 2019

Biomedical Text Mining and Ontologies参考文献 26被引用数 25

ひとこと要約

本論文では、臨床文書からの文脈的表現をEMLo埋め込みとトピックに敏感なアテンションを用いて向上させることで、医学用語の省略語の意味あいまい除去を改善する少数ショットニューラルトピックアテンションモデルを提案する。臨床ノート上で事前学習されたDoc2Vecモデルからのトピック情報を統合することで、手動で作成されバランスの取れたテストセットにおいて、ベースラインのLSTMモデル比でF1スコアが14.86%向上し、特にまれな意味の解消性能が顕著に向上した。

ABSTRACT

Automated analysis of clinical notes is attracting increasing attention. However, there has not been much work on medical term abbreviation disambiguation. Such abbreviations are abundant, and highly ambiguous, in clinical documents. One of the main obstacles is the lack of large scale, balance labeled data sets. To address the issue, we propose a few-shot learning approach to take advantage of limited labeled data. Specifically, a neural topic-attention model is applied to learn improved contextualized sentence representations for medical term abbreviation disambiguation. Another vital issue is that the existing scarce annotations are noisy and missing. We re-examine and correct an existing dataset for training and collect a test set to evaluate the models fairly especially for rare senses. We train our model on the training set which contains 30 abbreviation terms as categories (on average, 479 samples and 3.24 classes in each term) selected from a public abbreviation disambiguation dataset, and then test on a manually-created balanced dataset (each class in each term has 15 samples). We show that enhancing the sentence representation with topic information improves the performance on small-scale unbalanced training datasets by a large margin, compared to a number of baseline models.

研究の動機と目的

臨床ノートにおける低リソースで、不均衡かつノイズの多い省略語の意味あいまい除去データセットの課題に対処すること。
限られたラベル付きデータでの少数ショット学習を用いて、特にまれな省略語の意味の解消性能を向上させること。
既存の公開データセットを修正・再構築し、公平な評価が可能な信頼性の高いバランスの取れた学習およびテストセットを構築すること。
文脈的表現にトピック情報を統合することで、データが少ない状況下でのモデルの一般化性能を向上させること。
このタスクに対して、従来の手法とディープラーニングのベースラインを包括的に評価・比較する初の試み。

提案手法

モデルは、臨床文からの文脈に敏感な単語表現を捉えるためにEMLo埋め込みを用いる。
事前学習済みのDoc2VecモデルをMIMIC-IIIノート上で用いて得たトピックベクトルに注目するトピックアテンション機構を導入する。
トピック行列は、LDAトピックから得た上位語に畳み込み層を適用し、最大プーリングを施して固定長のトピックベクトルを形成することで生成される。
文の表現は、EMLoからの文脈特徴と、トピックベクトルへのアテンションによるトピックに敏感な特徴を連結することで形成される。
分類には、交差エントロピー損失で学習される、ソフトマックス関数を用いた全結合層が用いられる。
モデルはエンドツーエンドで微調整され、バックプロパゲーション中にEMLoとトピック表現の両方が更新される。

実験結果

リサーチクエスチョン

RQ1文脈埋め込みにトピック情報を統合することで、リソースが限られた状況下での医学用語の省略語の意味あいまい除去性能が向上するか。
RQ2提案されたトピックアテンションモデルは、LSTM や CNN といった強力なベースラインと比較して、まれな省略語の意味の分類におけるF1スコアと正答率でどのように差をつけるか。
RQ3単一の単語埋め込みと比較して、事前学習済みのEMLoが意味あいまい除去性能にどの程度向上効果をもたらすか。
RQ4EMLoとトピックに敏感なアテンションを組み合わせることで、個々のコンponentに比べて顕著な性能向上が得られるか。
RQ5クリーニングされバランスの取れたテストセットは、まれな省略語の意味の分類に対するモデルの公平な評価を可能にするか。

主な発見

提案されたEMLo+トピックモデルは、マクロF1スコア70.41%を達成し、ベースラインのLSTM-selfモデル（55.55%）比で14.86%の向上を示した。
モデルは74.76%の正答率を達成し、ベースライン比で12.27%の向上を示し、少数ショット学習における顕著な性能向上を示した。
トピックアテンションモジュール単体でも、ベースライン比でF1スコアが9.69%向上し、トピック情報の価値を示した。
EMLoのみのバージョンがトピックのみのバージョンを上回り、マクロF1スコア67.81%を達成した。これは、文脈埋め込みがトピック特徴単体よりも効果的であることを示している。
EMLo+トピックモデルの平均AUCスコア（0.8196）は、ベースラインモデル（0.7189）よりも顕著に高く、全用語においてより優れた識別性能を示した。
バランスの取れたテストセットにより、各用語について1つのクラスに正確に15件のサンプルが割り当てられたことから、モデルのまれな意味への性能が妥当に検証された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。