QUICK REVIEW

[论文解读] PneumoXttention: A CNN compensating for Human Fallibility when Detecting Pneumonia through CXR images with Attention

Sanskriti Singh|arXiv (Cornell University)|Aug 11, 2020

COVID-19 diagnosis using AI参考文献 10被引用 2

一句话总结

PneumoXttention 是一种13层卷积神经网络（CNN）集成模型，结合了新颖的注意力机制，可提升前后位胸片（CXR）图像中的肺炎检测效果。该模型在RSNA数据集上进行训练，在25张图像的测试集上取得了0.90的F1分数，优于标准CNN（F1：0.70），且在与人类放射科医生联合诊断时达到100%准确率。

ABSTRACT

Automatic Chest Radiograph X-ray (CXR) interpretation by machines is an important research topic of Artificial Intelligence. As part of my journey through the California Science Fair, I have developed an algorithm that can detect pneumonia from a CXR image to compensate for human fallibility. My algorithm, PneumoXttention, is an ensemble of two 13 layer convolutional neural network trained on the RSNA dataset, a dataset provided by the Radiological Society of North America, containing 26,684 frontal X-ray images split into the categories of pneumonia and no pneumonia. The dataset was annotated by many professional radiologists in North America. It achieved an impressive F1 score, 0.82, on the test set (20% random split of RSNA dataset) and completely compensated Human Radiologists on a random set of 25 test images drawn from RSNA and NIH. I don't have a direct comparison but Stanford's Chexnet has a F1 score of 0.435 on the NIH dataset for category Pneumonia.

研究动机与目标

为解决人类放射科医生在检测胸片图像肺炎时的局限性，尤其是在肺尖或心脏后方等困难区域的漏诊问题。
开发一种深度学习模型，通过聚焦于细微或被遮挡的密度影，弥补人类观察的疏漏。
在专家放射科医生稀缺的低资源环境中，提升诊断准确性。
为放射科医生提供可靠的第二诊疗意见工具，以减少误诊并挽救生命。

提出的方法

该模型采用两个13层卷积神经网络（CNN）的集成，基于RSNA数据集中的26,684张前后位胸片图像进行训练。
引入一种独特的注意力机制，以突出显示易被人类忽略的区域，如肺尖和心脏轮廓区域。
采用二元交叉熵损失函数进行二分类任务的训练：肺炎（1）与无肺炎（0）。
在RSNA数据集的20%随机测试集以及来自RSNA和NIH数据集的独立25张图像测试集上评估模型性能。
将模型性能与无注意力机制的标准CNN以及同一批测试集上的人类放射科医生进行对比。
通过在25张图像的盲法测试集上与放射科医生读片结果直接对比，对最终模型进行验证。

实验结果

研究问题

RQ1带有注意力机制的CNN是否能在胸片图像中检测肺炎方面优于标准CNN？
RQ2注意力机制是否能提升在人类放射科医生常漏诊解剖区域（如肺尖和心脏后方）的检测效果？
RQ3模型的预测结果是否能与人类放射科医生形成互补，实现高于单独任一方的诊断准确率？
RQ4AI模型在多大程度上可减少肺炎检测中的误诊，尤其是在复杂病例中？
RQ5该模型在NIH数据集上的性能与CheXNet等最先进模型相比如何？

主要发现

PneumoXttention在25张图像的测试集中取得了0.90的F1分数，显著优于无注意力机制的标准CNN（F1：0.70）。
当与人类放射科医生联合诊断时，模型与医生在相同25张图像测试集中达到100%的准确率。
该模型在测试集上实现了92%的准确率，高于表4中报告的人类放射科医生72%的准确率。
注意力机制使模型能够正确识别出常被放射科医生忽略的区域（如肺尖和心脏后方）的肺炎病灶。
在RSNA数据集测试集（20%）上的F1分数达到0.82，表明其具有良好的泛化能力。
结果表明，该模型可作为可靠的第二诊疗意见工具，尤其适用于放射科医生资源有限的环境。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。