QUICK REVIEW

[論文レビュー] Knowledge-guided Text Structuring in Clinical Trials.

Yingcheng Sun, Kenneth A. Loparo|arXiv (Cornell University)|Jan 1, 2019

Biomedical Text Mining and Ontologies被引用数 6

ひとこと要約

本論文では、自動生成された知識ベースと語の依存関係を用いて、被験者登録基準や結果要約などの複雑な臨床試験の自由記述文を、形式的でコンピュータが解釈可能な表現に変換する、知識誘導型のテキスト構造化フレームワークを提案する。この手法は高い正確性と再現率を達成しており、電子的患者スクリーニングおよびクエリ作成のための、複数エンティティ・複数関係を含む臨床テキストのパースに有効であることが示された。

ABSTRACT

Clinical trial records are variable resources or the analysis of patients and diseases. Information extraction from free text such as eligibility criteria and summary of results and conclusions in clinical trials would better support computer-based eligibility query formulation and electronic patient screening. Previous research has focused on extracting information from eligibility criteria, with usually a single pair of medical entity and attribute, but seldom considering other kinds of free text with multiple entities, attributes and relations that are more complex for parsing. In this paper, we propose a knowledge-guided text structuring framework with an automatically generated knowledge base as training corpus and word dependency relations as context information to transfer free text into formal, computer-interpretable representations. Experimental results show that our method can achieve overall high precision and recall, demonstrating the effectiveness and efficiency of the proposed method.

研究の動機と目的

単なるエンティティ-属性ペアをはるかに超えて、複雑な臨床試験の自由記述文から構造的でコンピュータが解釈可能な情報を抽出する課題に対処すること。
臨床試験要約および基準に含まれる複数のエンティティ、属性、関係をモデル化することで、電子的患者スクリーニングおよび登録クエリの作成を改善すること。
手動でキュ레이ティングされたコーパスに依存しない、スケーラブルな手法を開発することを目的とし、自動生成された知識ベースを学習データとして活用すること。
文脈特徴として語の依存関係を組み込むことで、関係性が豊富な自由記述文のパース精度を向上させること。
実世界の臨床試験文書の複雑さを扱う能力を評価すること

提案手法

フレームワークは、手動でのアノテーションを必要とせず、エンドツーエンドのテキスト構造化を可能にするために、自動生成された知識ベースを学習コーパスとして使用する。
臨床試験テキストから語の依存関係を抽出し、文脈的情報として活用することで、エンティティおよびその関係の表現を豊かにする。
非構造的自由記述文を、複数のエンティティ、属性、意味的関係を捉えた形式的で構造化された表現に変換する。
知識誘導型のアプローチにより、テキストを既知の医学的概念および関係と一致させることで、パースの整合性と解釈可能性を向上させる。
フレームワークは、語間の句構文的および意味的依存関係をモデル化するための依存構文解析を統合しており、関係性理解を強化する。
システムは、被験者登録基準および結果要約に焦点を当て、臨床試験記録を用いて学習および評価される

実験結果

リサーチクエスチョン

RQ1複数のエンティティと関係を含む複雑な臨床試験テキストを、知識誘導型フレームワークが効果的に構造化できるか？
RQ2自動生成された知識ベースを用いることで、臨床試験におけるテキスト構造化のパフォーマンスにどのような影響を与えるか？
RQ3語の依存関係を組み込むことで、臨床の自由記述文のパース精度はどの程度向上するか？
RQ4この手法は、非構造的臨床テキストを形式的で機械が解釈可能な表現に変換する際に、高い正確性と再現率を達成できるか？

主な発見

提案手法は、臨床試験の自由記述文を構造的でコンピュータが解釈可能な形式に変換する際に、高い正確性と再現率を達成した。
語の依存関係の統合により、臨床テキストにおける複雑な関係性のモデリングが顕著に向上した。
自動生成された知識ベースの使用により、手動でアノテートされたデータセットに依存せずに効果的な学習が可能になった。
フレームワークは、臨床試験要約および被験者登録基準における複数エンティティ・複数関係のコンテンツを効果的に処理できた。
この手法は、電子的患者スクリーニングなどの後続応用を支援する多様な臨床テキストタイプにおいて、強力なパフォーマンスを示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。