Skip to main content
QUICK REVIEW

[论文解读] COVID-19: A Survey on Public Medical Imaging Data Resources

Roman Kalkreuth, Paul Kaufmann|arXiv (Cornell University)|Apr 8, 2020
COVID-19 diagnosis using AI参考文献 8被引用 25
一句话总结

本综述整理并分类了公开可用的新冠肺炎医学影像数据集,涵盖CT、X光和超声扫描及其相关元数据。该综述通过整合资源以加速诊断和模型开发,支持人工智能与机器学习研究,重点在于利用开放数据源提高早期检测和分类准确性的研究。

ABSTRACT

This regularly updated survey provides an overview of public resources that offer medical images and metadata of COVID-19 cases. The purpose of this survey is to simplify the access to open COVID-19 image data resources for all scientists currently working on the coronavirus crisis.

研究动机与目标

  • 整合并记录公开可访问的新冠肺炎病例医学影像数据集,以支持人工智能驱动的研究。
  • 解决用于训练和验证机器学习模型的大规模、开放且标注良好的医学影像数据稀缺的问题。
  • 为致力于新冠肺炎早期检测和分类研究的科研人员提供快速获取影像资源的途径。
  • 通过在符合伦理和隐私保护的前提下推广开放获取影像数据,促进数据共享与透明度。
  • 为在疫情期间寻求可靠、公开可用影像数据的科学家提供定期更新的参考资源。

提出的方法

  • 系统性地从不同机构和平台收集并分类公开可用的与新冠肺炎相关的医学影像数据集。
  • 根据成像方式(CT、X光、MRT、超声)、元数据存在与否以及病例评审可获得性对数据集进行分类。
  • 使用标准化标签(Y = 是,N = 否,U = 不明)表示13个关键数据集中各项数据的可获得性。
  • 纳入来自主要机构如艾伦人工智能研究所、加州大学圣地亚哥分校及欧洲放射学会等的资源。
  • 定期更新本综述,以反映新数据发布和社区贡献。
  • 鼓励社区提交数据和报告错误,以保持数据的准确性和完整性。

实验结果

研究问题

  • RQ1目前研究人员可访问的公开新冠肺炎医学影像数据集有哪些?
  • RQ2在现有公开数据集中,哪些成像方式(如CT、X光、超声)最为常见?
  • RQ3不同公开数据资源中元数据和病例级标注的全面性如何?
  • RQ4在新冠肺炎诊断的人工智能与机器学习应用中,当前开放数据的可获得性处于何种状态?
  • RQ5研究人员如何高效地发现并获取可靠、开源的医学影像数据以支持疫情相关研究?

主要发现

  • 本综述识别出13个公开的新冠肺炎医学影像资源,包括来自艾伦人工智能研究所、加州大学圣地亚哥分校及欧洲放射学会平台等机构的数据集。
  • CT和X光成像为最常提供的模态,13个数据集中有10个提供CT或X光扫描。
  • 13个数据集中有11个提供元数据,表明对数据来源和病例级信息的支持较强。
  • 13个数据集中有5个包含病例评审,表明临床标注的可用性有限但正在逐步增加。
  • SIRM新冠肺炎数据库和eurorad.org是最大的存储库之一,提供CT、X光和元数据,并包含病例级评审。
  • 本综述强调了开放数据获取的重要性,并鼓励研究人员贡献和引用该资源,以提升数据可及性与研究可重复性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。