Skip to main content
QUICK REVIEW

[논문 리뷰] How essential are unstructured clinical narratives and information fusion to clinical trial recruitment?

Preethi Raghavan, James L. Chen|PubMed|2015. 02. 13.
Biomedical Text Mining and Ontologies참고 문헌 17인용 수 36
한 줄 요약

이 연구는 만성 림프성 백혈병(CLL) 및 전립선암 임상 시험에서 환자 자격 기준을 정확히 판단하기 위해 비정형 임상 내역과 정보 융합이 필수적임을 입증한다. 구조화된 전자 의무기록(EHR) 데이터와 비정형 EHR 데이터를 기반으로 자연어 처리와 시간적 추론를 적용한 결과, CLL 시험의 59% 및 전립선암 시험의 77% 자격 기준이 임상 내역에서 정보를 필요로 함을 확인하여, 구조화된 데이터만으로는 효과적인 모집이 불가능함을 시사한다.

ABSTRACT

Electronic health records capture patient information using structured controlled vocabularies and unstructured narrative text. While structured data typically encodes lab values, encounters and medication lists, unstructured data captures the physician's interpretation of the patient's condition, prognosis, and response to therapeutic intervention. In this paper, we demonstrate that information extraction from unstructured clinical narratives is essential to most clinical applications. We perform an empirical study to validate the argument and show that structured data alone is insufficient in resolving eligibility criteria for recruiting patients onto clinical trials for chronic lymphocytic leukemia (CLL) and prostate cancer. Unstructured data is essential to solving 59% of the CLL trial criteria and 77% of the prostate cancer trial criteria. More specifically, for resolving eligibility criteria with temporal constraints, we show the need for temporal reasoning and information integration with medical events within and across unstructured clinical narratives and structured data.

연구 동기 및 목표

  • 비정형 임상 내역이 임상 시험 자격 기준을 해결하는 데 필요한지 평가하기 위해.
  • 구조화된 데이터만으로 자격 기준을 해결할 수 있는지 여부 또는 내역 텍스트와의 융합이 필수적인지 평가하기 위해.
  • EHR 데이터 소스 간 자격 제약 조건을 해석하는 데 있어 시간적 추론의 역할을 조사하기 위해.
  • 비정형 내역에서 정보 추출에 의존하는 기준의 비율을 정량화하기 위해.
  • 온콜로지 임상 시험에서 환자 모집을 위해 구조화된 EHR 데이터에만 의존할 경우의 한계를 입증하기 위해.

제안 방법

  • 만성 림프성 백혈병(CLL) 및 전립선암 환자의 실제 세계 EHR 데이터를 사용한 실증 연구를 수행하였다.
  • 두 질환에 대한 임상 시험 프로토콜에서 자격 기준을 추출하고 분석하였다.
  • 비정형 내역 노트에서 임상적으로 관련 있는 정보를 추출하기 위해 자연어 처리(NLP) 기법을 적용하였다.
  • 정보 융합을 통해 비정형 내역의 결과를 구조화된 데이터(예: 검사값, 약물 복용 내역)와 통합하였다.
  • 질병 지속 기간, 이전 치료 내역, 반응 시간대와 같은 시간에 따라 달라지는 기준을 해결하기 위해 시간적 추론을 수행하였다.
  • 자격 기준 해결을 위해 내역 데이터가 필요한 비율을 정량화하였으며, 구조화된 데이터만 사용하는 것과 융합된 데이터 접근 방식을 비교하였다.

실험 결과

연구 질문

  • RQ1비정형 임상 내역이 임상 시험 자격 기준 해결에 얼마나 기여하는가?
  • RQ2구조화된 EHR 데이터만으로도 임상 시험 자격 기준을 해결할 수 있는가, 아니면 내역 텍스트와의 융합이 필수적인가?
  • RQ3시간적 추론이 임상 데이터 소스 간 자격 제약 조건을 해석하는 데 얼마나 중요한가?
  • RQ4CLL 및 전립선암 시험의 자격 기준 중 얼마나 많은 비율이 임상 내역에서 추출한 정보에 의존하는가?
  • RQ5구조화된 데이터와 비정형 데이터 간의 정보 융합이 환자 모집 정확도 향상에 어떻게 기여하는가?

주요 결과

  • 비정형 임상 내역은 만성 림프성 백혈병(CLL) 시험의 59% 자격 기준 해결에 필수적이었다.
  • 전립선암 시험의 경우, 77%의 자격 기준이 해결되기 위해 비정형 내역에서 정보가 필요했다.
  • 구조화된 데이터만으로는 대부분의 자격 기준을 해결하기에 부족했으며, 특히 임상적 판단, 예후 또는 치료 반응과 관련된 기준에서는 더욱 그러했다.
  • 비정형 내역과 구조화된 데이터 간의 시간적 추론은 질병 지속 기간 및 치료력과 같은 시간에 따라 달라지는 제약 조건 해결에 핵심적이었다.
  • 비정형 내역과 구조화된 데이터 간의 정보 융합은 환자 자격 결정의 완전성과 정확도를 크게 향상시켰다.
  • 본 연구는 구조화된 데이터에만 의존할 경우, 임상 노트에 기록된 중요한 자격 정보를 놓치게 되어 상당한 모집 부족이 발생할 수 있음을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.