[논문 리뷰] Comp2Comp: Open-Source Software with FDA-Cleared Artificial Intelligence Algorithms for Computed Tomography Image Analysis
Comp2Comp은 다기관에 걸친 투명한 검증을 갖춘 기회성 CT 분석용 오픈 소스 AI 파이프라인(AAQ 및 BMD)을 FDA-510(k) 승인된 형태로 제공합니다.
Artificial intelligence allows automatic extraction of imaging biomarkers from already-acquired radiologic images. This paradigm of opportunistic imaging adds value to medical imaging without additional imaging costs or patient radiation exposure. However, many open-source image analysis solutions lack rigorous validation while commercial solutions lack transparency, leading to unexpected failures when deployed. Here, we report development and validation for two of the first fully open-sourced, FDA-510(k)-cleared deep learning pipelines to mitigate both challenges: Abdominal Aortic Quantification (AAQ) and Bone Mineral Density (BMD) estimation are both offered within the Comp2Comp package for opportunistic analysis of computed tomography scans. AAQ segments the abdominal aorta to assess aneurysm size; BMD segments vertebral bodies to estimate trabecular bone density and osteoporosis risk. AAQ-derived maximal aortic diameters were compared against radiologist ground-truth measurements on 258 patient scans enriched for abdominal aortic aneurysms from four external institutions. BMD binary classifications (low vs. normal bone density) were compared against concurrent DXA scan ground truths obtained on 371 patient scans from four external institutions. AAQ had an overall mean absolute error of 1.57 mm (95% CI 1.38-1.80 mm). BMD had a sensitivity of 81.0% (95% CI 74.0-86.8%) and specificity of 78.4% (95% CI 72.3-83.7%). Comp2Comp AAQ and BMD demonstrated sufficient accuracy for clinical use. Open-sourcing these algorithms improves transparency of typically opaque FDA clearance processes, allows hospitals to test the algorithms before cumbersome clinical pilots, and provides researchers with best-in-class methods.
연구 동기 및 목표
- 오포트런스틱 CT 분석을 위한 FDA 승인 AI의 투명성 격차를 해소하기 위해 오픈 소스 파이프라인과 주요 데이터를 제공한다.
- CT 기반 체성분 평가를 위한 두 개의 FDA 510(k) 승인 모듈(A AQ 및 BMD)을 개발하고 검증한다.
- 병원과 연구자가 오픈 코드와 모델로 최고 수준의 AI 방법을 시험하고 채택할 수 있도록 한다.
제안 방법
- AAQ 파이프라인은 nnU-Net을 사용하여 복부 대동맥을 분절하고 최대 축 방향 직경 및 QC 출력값을 산출한다.
- BMD 파이프라인은 커스텀 nnU-Net을 사용하여 L1–L4 척추뼈를 분절하고 방사선밀도 정규화와 DXA 유래 T-스코어에 대한 이진 임계값을 통해 척추 트래베큘라 BMD를 추정한다.
- 검증 데이터 세트는 다양한 스캐너와 프로토콜을 갖춘 다기관 CC 스캔으로 구성되어 실제 세계의 변화를 반영한다.
- FDA 서류의 핵심 엔드포인트와 통계 분석은 투명성을 극대화하기 위해 원문대로 본문에 모두 보고된다.
- 플랫폼 자체는 Apache License 2.0 하에 오픈 소스이며; AAQ 및 BMD 모듈은 FDA 승인되었지만 Comp2Comp 플랫폼 자체는 승인되지 않았다.

실험 결과
연구 질문
- RQ1다양한 스캐너와 환자 해부학적 차이를 넘어 CT에서 AAQ가 복부 대동맥의 최대 직경을 정확하게 측정할 수 있는가?
- RQ2CT에서 얻은 척추 ROI를 바탕으로 DXA와 비교하여 BMD가 낮은지 정상인지 신뢰할 수 있게 분류할 수 있는가?
- RQ3연령, 성별, 스캐너 제조사, 커널, 슬라이스 두께와 같은 하위 그룹에 따라 모델 성능 지표가 어떻게 달라지는가?
- RQ4FDA 승인을 받은 모듈의 오픈 소스화가 비공개 소스 솔루션과 비교하여 지역적 검증과 채택을 개선하는가?
주요 결과
- AAQ는 평균 절대 오차 1.58 mm(95% CI 1.375–1.797)와 방사선 전문의-모델 ICC 0.985(95% CI 0.979–0.989)를 달성했다.
- BMD 분류는 민감도 81.0% 및 특이도 78.4%(DXA T-score 임계값 -1.0)로 PPV 73.6% 및 NPV 84.8%를 보였다.
- 연속 BMD 점수는 DXA T-score와 r = 0.791(95% CI 0.752–0.830)로 상관되었으며; 연속 점수 AUROC = 0.883이고 이진 AUROC = 0.797.
- AAQ 및 BMD는 FDA 510(k) 승인을 받았다 (AAQ K243779 2025-07-01; BMD K242295 2025-04-08).
- AAQ 성능은 대부분의 하위그룹에서 견고했으나 엔도그래프트 환자에서 정확도가 낮아졌다(MAE 3.964 mm).
- 오픈 소스인 Comp2Comp 저장소(Apache 2.0)는 이들 FDA 승인 방법의 테스트 및 재현을 가능하게 한다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.