[論文レビュー] XLSor: A Robust and Accurate Lung Segmentor on Chest X-Rays Using Criss-Cross Attention and Customized Radiorealistic Abnormalities Generation
XLSorは胸部X線の肺セグメンテーションにグローバル文脈を提供するクリスククロスアテンションを導入し、放射線リアリスティック abnormal CXRデータ拡張で頑健性を向上させ、異常および正常のCXRで優れた性能を達成します。
This paper proposes a novel framework for lung segmentation in chest X-rays. It consists of two key contributions, a criss-cross attention based segmentation network and radiorealistic chest X-ray image synthesis (i.e. a synthesized radiograph that appears anatomically realistic) for data augmentation. The criss-cross attention modules capture rich global contextual information in both horizontal and vertical directions for all the pixels thus facilitating accurate lung segmentation. To reduce the manual annotation burden and to train a robust lung segmentor that can be adapted to pathological lungs with hazy lung boundaries, an image-to-image translation module is employed to synthesize radiorealistic abnormal CXRs from the source of normal ones for data augmentation. The lung masks of synthetic abnormal CXRs are propagated from the segmentation results of their normal counterparts, and then serve as pseudo masks for robust segmentor training. In addition, we annotate 100 CXRs with lung masks on a more challenging NIH Chest X-ray dataset containing both posterioranterior and anteroposterior views for evaluation. Extensive experiments validate the robustness and effectiveness of the proposed framework. The code and data can be found from https://github.com/rsummers11/CADLab/tree/master/Lung_Segmentation_XLSor .
研究の動機と目的
- 正常と異常のケースを問わず、自動診断を支援するために胸部X線の肺セグメンテーションを正確に行う動機づけ。
- クロス-クロスアテンション(CCA)を用いてグローバルな文脈情報を捉えるセグメンテーションフレームワークを開発。
- 放射線リアリスティックな異常CXR生成と疑似マスクによる頑健な学習でアノテーション負担を削減。
- PAおよびAPビューを含むNIH Chest X-raysを含む複数のデータセットで評価し、一般化をテスト。
提案手法
- CNNバックボーン内でcriss-cross attentionモジュールを用いてピクセル単位のセグメンテーションの水平・垂直のグローバル文脈を捉える。
- 最後のダウンサンプリング層を膨張畳み込みに置換して、ハイレゾリューションの文脈のためにストライドを8にする。
- 密に文脈情報を集約するために2段のCCAリカレント配置を採用。
- MUNITを用いて正規CXRから放射線リアリスティックな異常CXRを生成し、訓練拡張用の疑似マスクとして正規マスクを伝播。
- 実データと拡張データを用いてXLSorを訓練し、U-Netのベースラインと比較評価。
- 一般化を評価するために100例の異常NIH CXRにアノテーションを行う。
実験結果
リサーチクエスチョン
- RQ1異常/病理的条件下でも、criss-cross attentionはCXRsでのグローバルな文脈推論を改善し、正確な肺セグメンテーションにつながるか。
- RQ2疑似マスクを用いた放射線リアリスティック拡張は、PAおよびAPビューにわたる未知の異常CXRに対する頑健性と一般化を高めるか。
- RQ3通常および異常CXRのセグメンテーション設定で、XLSorは標準のU-Netベースラインとどう比較されるか。
主な発見
| CXR マスク | U-Net R | U-Net A^4 | U-Net R+A^4 | XLSor R | XLSor A^4 | XLSor R+A^4 |
|---|---|---|---|---|---|---|
| REC | 0.976 ± 0.02 | 0.963 ± 0.03 | 0.972 ± 0.02 | 0.973 ± 0.02 | 0.967 ± 0.02 | 0.974 ± 0.02 |
| PRE | 0.968 ± 0.03 | 0.979 ± 0.02 | 0.970 ± 0.03 | 0.979 ± 0.02 | 0.983 ± 0.01 | 0.976 ± 0.01 |
| DICE | 0.972 ± 0.02 | 0.971 ± 0.02 | 0.975 ± 0.01 | 0.976 ± 0.01 | 0.973 ± 0.01 | 0.975 ± 0.01 |
| AVD | 0.198 ± 0.56 | 0.162 ± 0.36 | 0.131 ± 0.34 | 0.149 ± 0.51 | 0.098 ± 0.07 | 0.078 ± 0.06 |
| VS | 0.988 ± 0.02 | 0.989 ± 0.01 | 0.990 ± 0.01 | 0.992 ± 0.01 | 0.991 ± 0.01 | 0.993 ± 0.01 |
- XLSorは公開テストとNIHデータセットの両方でU-Netを上回り、未確認の異常CXRで顕著な改善を示す(例:Diceスコアの向上)。
- 放射線リアリスティック拡張サンプル(A^i)を追加すると、実データのみを使用する場合より一貫して性能が向上。
- CCAモジュールを用いたcriss-cross attentionはグローバル文脈学習を促進し、難易度の高いケースでより良いセグメンテーションを生み出す。
- 拡張付き訓練(R+A^4)を行ったモデルはNIHデータで頑健な性能を発揮し、より複雑な異常CXRへの良好な一般化を示す。
- 拡張データのみで訓練(A^4)しても、XLSorは公開データセットとNIHデータセットの両方で競争力のある結果を達成し、疑似マスク監督が有効であることを示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。