QUICK REVIEW

[논문 리뷰] VISION-ICE: Video-based Interpretation and Spatial Identification of Arrhythmia Origins via Neural Networks in Intracardiac Echocardiography

Dorsa EPMoghaddam, Feng Gao|arXiv (Cornell University)|2026. 02. 04.

Cardiac Arrhythmias and Treatments인용 수 0

한 줄 요약

연구는 3D CNN 프레임워크를 사용하여 intracardiac echocardiography(ICE) 비디오를 이용해 부정맥 원인을 세 가지 클래스로 분류하며, 10배 환자 수준 교차 검증에서 보지 않은 환자에 대한 평균 정확도는 66.2%를 달성합니다.

ABSTRACT

Contemporary high-density mapping techniques and preoperative CT/MRI remain time and resource intensive in localizing arrhythmias. AI has been validated as a clinical decision aid in providing accurate, rapid real-time analysis of echocardiographic images. Building on this, we propose an AI-enabled framework that leverages intracardiac echocardiography (ICE), a routine part of electrophysiology procedures, to guide clinicians toward areas of arrhythmogenesis and potentially reduce procedural time. Arrhythmia source localization is formulated as a three-class classification task, distinguishing normal sinus rhythm, left-sided, and right-sided arrhythmias, based on ICE video data. We developed a 3D Convolutional Neural Network trained to discriminate among the three aforementioned classes. In ten-fold cross-validation, the model achieved a mean accuracy of 66.2% when evaluated on four previously unseen patients (substantially outperforming the 33.3% random baseline). These results demonstrate the feasibility and clinical promise of using ICE videos combined with deep learning for automated arrhythmia localization. Leveraging ICE imaging could enable faster, more targeted electrophysiological interventions and reduce the procedural burden of cardiac ablation. Future work will focus on expanding the dataset to improve model robustness and generalizability across diverse patient populations.

연구 동기 및 목표

ICE 유도 전기생리학 절차 중 부정맥 기원 위치 추정의 필요성을 효율적이고 AI 지원으로 충족한다.
ICE 비디오에서 NSR, 좌측 및 우측 부정맥을 구분하는 3분류 분류 프레임워크를 개발한다.
표준화된 전처리 및 증강을 포함한 ICE 비디오 데이터셋을 큐레이션한다.
강건한 교차 검증을 통해 다양한 ICE 뷰 및 클립/환자 수준에서 성능을 평가한다.

제안 방법

ICE 비디오 분류를 위한 grayscale 입력 스템을 갖춘 사전 학습된 3D ResNet-18 백본을 사용한다.
마스킹, 시간적 분할, 자르기/크기 조정, 정규화를 통해 텐서를 (1,32,H,W) 형태로 생성한다.
클래스 가중치가 반영된 교차 엔트로피 손실과 혼합 정밀도(mixed precision)로 AdamW를 사용해 학습하며 조기 중단 및 학습률 스케줄링을 적용한다.
10배 환자 간 교차 검증을 수행하고, 해부학적 뷰별로 별도의 모델을 학습한 뒤 다수결 투표로 클립 및 환자 수준의 예측을 융합한다.
해석 가능성을 높이기 위해 Grad-CAM을 사용해 예측에 기여하는 시공간 영역을 시각화한다.

실험 결과

연구 질문

RQ1ICE 비디오 데이터를 이용해 해부학적 뷰를 기반으로 NSR, DIST, PROX의 3클래스 설정에서 부정맥 기원을 정확하게 위치 추정할 수 있는가?
RQ2다중 ICE 뷰를 합산했을 때 보지 않은 환자에 대한 3D-CNN 분류기의 성능은 어떠한가?
RQ3뷰 간 융합이 단일 뷰 모델에 비해 부정맥 기원 위치 추정의 견고성 및 정확성을 향상시키는가?
RQ4Grad-CAM으로 ICE 비디오의 모델 결정이 해석 가능한가?

주요 결과

폴드별 Cross-View Majority Voting의 평균 클립 수준 정확도는 66.20%에 도달했다.
뷰별 검증 정확도는 폴드 및 뷰에 따라 다양하며, 평균 TV 71.27%, MV 77.09%, LPV 73.03%, CT 62.97%가 폴드 전반에 걸쳐 나타났다.
뷰 간 융합은 견고성을 높여 단일 뷰 결과보다 더 높은 최종 환자 수준 결정으로 이어지는 경우가 다수의 폴드에서 관찰되었다.
Grad-CAM 시각화는 모델의 주의가 생리적으로 관련된 심방 구조에 집중됨을 보여주어 의미 있는 특징 학습을 뒷받침한다.
전이 학습과 데이터 증강을 활용한 미세 조정된 3D CNN을 이용한 ICE 비디오 기반 부정맥 위치 추정의 가능성을 입증했다.
훈련은 데이터 누수를 방지하고 보지 않은 환자에 대한 일반화를 보장하기 위해 엄격한 환자 간 분할을 사용했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.