[论文解读] MIMIC-CXR-JPG, a large publicly available database of labeled chest radiographs
本论文提出 MIMIC-CXR-JPG v2.0.0,一种大型去识别的 377,110 张 JPEG 胸部 X 光数据集,含自 radiology reports 派生的 14 个病理标签,用于基准医疗计算机视觉任务。
Chest radiography is an extremely powerful imaging modality, allowing for a detailed inspection of a patient's thorax, but requiring specialized training for proper interpretation. With the advent of high performance general purpose computer vision algorithms, the accurate automated analysis of chest radiographs is becoming increasingly of interest to researchers. However, a key challenge in the development of these techniques is the lack of sufficient data. Here we describe MIMIC-CXR-JPG v2.0.0, a large dataset of 377,110 chest x-rays associated with 227,827 imaging studies sourced from the Beth Israel Deaconess Medical Center between 2011 - 2016. Images are provided with 14 labels derived from two natural language processing tools applied to the corresponding free-text radiology reports. MIMIC-CXR-JPG is derived entirely from the MIMIC-CXR database, and aims to provide a convenient processed version of MIMIC-CXR, as well as to provide a standard reference for data splits and image labels. All images have been de-identified to protect patient privacy. The dataset is made freely available to facilitate and encourage a wide range of research in medical computer vision.
研究动机与目标
- 提供一个处理过的、JPEG 格式的 MIMIC-CXR 子集,便于胸部放射影像的计算机视觉研究。
- 提供标准化的数据分割和标签,以便在不同研究之间实现公平基准。
- 在保持临床相关影像内容的同时,确保去识别和 HIPAA 安全性。
提出的方法
- 从 MIMIC-CXR 提取 DICOM 图像并转换为 JPEG,同时进行 12 位到 8 位深度归一化。
- 应用直方图均衡和方向归一化以提高对比度。
- 通过自动文本注释检测进行去识别 PHI,并进行人工审核以保护隐私。
- 使用两种开源标注工具(NegBio 和 CheXpert)从放射报告中生成标签。
- 提供带 CXR 图像和研究计数的训练、验证和测试分割;公开发布验证集。
实验结果
研究问题
- RQ1大型、有标签的 JPEG 胸部 X 线数据集是否有助于放射学计算机视觉方法的稳健基准?
- RQ2标准化的分割和标注方法是否能在模型与研究之间实现可重复的评估?
- RQ3自动标注工具(NegBio、CheXpert)在该数据集中相对于人工放射科医师标注的表现如何?
- RQ4去识别与图像预处理对数据集在研究中的可用性有何影响?
主要发现
- 该数据集包含 377,110 张胸部 X 光来自 227,827 影像研究,收集于 2011–2016 年在 BIDMC。
- 影像经过去识别并转换为 JPEG,采用标准化预处理,并从放射报告派生 14 个标签。
- 标签使用 NegBio 和 CheXpert,并包含用于标签冲突的 Disagreement 类别。
- 提供训练、验证和测试分割,测试集对评估完整性保持公开保留。
- 对 687 份人工标注报告的验证研究显示不同标注者和任务的性能差异,某些标签达到较高的 F1 分数(如 Pneumonia、Atelectasis、Pleural Effusion),而其他标签较低。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。