[论文解读] Developing and Deploying Machine Learning Pipelines against Real-Time Image Streams from the PACS.
Niffler 是一个框架,通过高效地查询和从医院PACS系统中检索DICOM数据,实现了对放射科图像的实时和回溯性机器学习流水线执行。它支持元数据提取、过滤、结果的去标识化共享,并在19个月的稳定运行中展示了在三个临床用例中的可行性。
Executing machine learning (ML) pipelines in real-time on radiology images is hard due to the limited computing resources in clinical environments and the lack of efficient data transfer capabilities to run them on research clusters. We propose Niffler, an integrated framework that enables the execution of ML pipelines at research clusters by efficiently querying and retrieving radiology images from the Picture Archiving and Communication Systems (PACS) of the hospitals. Niffler uses the Digital Imaging and Communications in Medicine (DICOM) protocol to fetch and store imaging data and provides metadata extraction capabilities and Application programming interfaces (APIs) to apply filters on the images. Niffler further enables the sharing of the outcomes from the ML pipelines in a de-identified manner. Niffler has been running stable for more than 19 months and has supported several research projects at the department. In this paper, we present its architecture and three of its use cases: an inferior vena cava (IVC) filter detection from the images in real-time, identification of scanner utilization, and scanner clock calibration. Evaluations on the Niffler prototype highlight its feasibility and efficiency in facilitating the ML pipelines on the images and metadata in real-time and retrospectively.
研究动机与目标
- 解决在计算资源有限且数据传输能力差的临床环境中执行机器学习流水线的挑战。
- 通过标准化的DICOM协议,实现对医院PACS系统中医学影像数据的高效、实时访问。
- 在不损害患者隐私的前提下,为机器学习流水线提供元数据提取和过滤功能。
- 支持跨研究项目对机器学习流水线结果的去标识化共享。
- 在真实临床研究场景中展示该框架的可行性和效率。
提出的方法
- Niffler 使用DICOM协议,安全地直接从医院PACS系统中查询和检索影像数据。
- 它从DICOM研究中提取元数据,并通过API提供基于成像参数或临床标准的过滤功能。
- 通过维持持久的数据流水线,该框架支持对图像流的实时和回溯处理。
- 机器学习流水线在研究集群上使用检索到的数据执行,从而将计算与临床影像基础设施解耦。
- 机器学习分析结果以去标识化格式共享,以确保患者隐私和合规性。
- 该系统架构设计为可跨多个研究项目扩展,并可与现有医院IT工作流程集成。
实验结果
研究问题
- RQ1该框架能否高效且安全地从医院PACS系统中检索实时放射科图像,以支持研究用的机器学习流水线?
- RQ2如何将元数据提取和过滤功能集成到处理PACS图像的流水线中,同时避免给临床系统带来过重负担?
- RQ3在实时和回溯处理场景下,使用从PACS检索的数据在研究集群上执行机器学习流水线的可行程度如何?
- RQ4该框架能否在保障数据隐私的前提下支持机器学习结果的去标识化共享?
- RQ5在临床研究环境中部署此类系统后,其实际性能和稳定性表现如何?
主要发现
- Niffler 在临床研究环境中已稳定运行超过19个月,证明了其长期可靠性。
- 该框架成功实现了通过从PACS检索的数据实时检测放射科图像中的下腔静脉(IVC)滤器。
- 通过分析成像工作流元数据,它支持识别扫描仪使用模式。
- Niffler 通过检测研究采集时间戳中的时间不一致性,促进了扫描仪时钟校准。
- 该系统实现了高效的数据传输和处理,减少了临床环境中对本地计算资源的依赖。
- 机器学习结果的去标识化共享已成功实现,支持了跨研究项目的协作。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。