QUICK REVIEW

[논문 리뷰] Knowledge-guided Text Structuring in Clinical Trials.

Yingcheng Sun, Kenneth A. Loparo|arXiv (Cornell University)|2019. 01. 01.

Biomedical Text Mining and Ontologies인용 수 6

한 줄 요약

이 논문은 복잡한 임상 시험 자유 텍스트(예: 입원 기준 및 결과 개요)를 자동으로 생성된 지식 기반과 어순 의존 관계를 사용하여 형식적이고 컴퓨터가 해석할 수 있는 표현으로 변환하는 지식 유도형 텍스트 구조화 프레임워크를 제안한다. 이 방법은 높은 정밀도와 재현율을 달성하여 다중 엔티티, 다중 관계를 포함한 임상 텍스트를 파싱하는 데 효과적임을 입증한다. 이는 전자적 환자 선별 및 질의 문장 구성 향상에 기여한다.

ABSTRACT

Clinical trial records are variable resources or the analysis of patients and diseases. Information extraction from free text such as eligibility criteria and summary of results and conclusions in clinical trials would better support computer-based eligibility query formulation and electronic patient screening. Previous research has focused on extracting information from eligibility criteria, with usually a single pair of medical entity and attribute, but seldom considering other kinds of free text with multiple entities, attributes and relations that are more complex for parsing. In this paper, we propose a knowledge-guided text structuring framework with an automatically generated knowledge base as training corpus and word dependency relations as context information to transfer free text into formal, computer-interpretable representations. Experimental results show that our method can achieve overall high precision and recall, demonstrating the effectiveness and efficiency of the proposed method.

연구 동기 및 목표

단순한 엔티티-속성 쌍을 초월하여 복잡한 임상 시험 자유 텍스트에서 구조화되고 컴퓨터가 해석할 수 있는 정보를 추출하는 데 도전하는 것.
임상 시험 요약 및 기준에 포함된 다중 엔티티, 속성, 관계를 모델링하여 전자적 환자 선별 및 입원 기준 질의 문장 구성 향상에 기여하는 것.
수동으로 코딩된 코퍼스에 의존하지 않고 자동 생성된 지식 기반을 훈련 데이터로 활용함으로써 확장 가능한 방법 개발하는 것.
어순 의존 관계를 문맥적 특징으로 통합하여 관계적 내용이 풍부한 자유 텍스트의 파싱 정확도 향상하는 것.
실제 임상 시험 문서의 복잡성을 다루는 데 있어 이 방법의 효과성 평가하는 것.

제안 방법

프레임워크는 수동 주석 처리가 필요 없이 종단 간 텍스트 구조화를 지원하기 위해 자동으로 생성된 지식 기반을 훈련 코퍼스로 사용한다.
임상 시험 텍스트에서 어순 의존 관계를 추출하여 문맥 정보로 활용함으로써 엔티티 및 그 관계의 표현을 풍부하게 한다.
비구조화된 자유 텍스트를 다중 엔티티, 속성, 의미 관계를 포괄하는 형식적이고 구조화된 표현으로 변환한다.
지식 유도 접근법을 통해 텍스트를 알려진 의학적 개념과 관계와 일치시켜 파싱의 일관성과 해석 가능성 향상한다.
의존성 분석을 통합하여 단어 간 문법적 및 의미적 의존 관계를 모델링함으로써 관계 이해를 향상시킨다.
시스템은 입원 기준 및 결과 요약에 중점을 두고 임상 시험 기록을 사용하여 훈련 및 평가한다.

실험 결과

연구 질문

RQ1지식 유도 프레임워크는 다중 엔티티 및 관계를 포함한 복잡한 임상 시험 텍스트를 효과적으로 구조화할 수 있는가?
RQ2자동 생성된 지식 기반을 사용할 경우 임상 시험의 텍스트 구조화 성능에 어떤 영향을 미치는가?
RQ3어순 의존 관계는 임상 자유 텍스트의 파싱 정확도를 어느 정도 향상시키는가?
RQ4이 방법은 비구조화된 임상 텍스트를 형식적이고 기계가 해석할 수 있는 표현으로 변환하는 데 높은 정밀도와 재현율을 달성하는가?

주요 결과

제안된 방법은 임상 시험 자유 텍스트를 구조화되고 컴퓨터가 해석할 수 있는 형식으로 변환하는 데 높은 정밀도와 재현율을 달성한다.
어순 의존 관계의 통합은 임상 텍스트 내 복잡한 관계 모델링에 있어 뚜렷한 향상을 이룬다.
자동 생성된 지식 기반의 사용은 수동 주석 처리된 데이터셋에 의존하지 않고도 효과적인 훈련을 가능하게 한다.
프레임워크는 임상 시험 요약 및 입원 기준의 다중 엔티티 및 다중 관계 내용을 성공적으로 처리한다.
이 방법은 다양한 임상 텍스트 유형에서 뛰어난 성능을 보이며 전자적 환자 선별과 같은 후속 응용 분야를 지원한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.