[論文レビュー] Weakly Supervised Medical Diagnosis and Localization from Multiple Resolutions
本論文は、画像レベルのラベルのみを用いて胸部X線の異常を診断・局在する多解像度の弱教師ありフレームワークを提案し、適応可能な顕在性マップのための新規な LSE-LBA プーリングを導入します。
Diagnostic imaging often requires the simultaneous identification of a multitude of findings of varied size and appearance. Beyond global indication of said findings, the prediction and display of localization information improves trust in and understanding of results when augmenting clinical workflow. Medical training data rarely includes more than global image-level labels as segmentations are time-consuming and expensive to collect. We introduce an approach to managing these practical constraints by applying a novel architecture which learns at multiple resolutions while generating saliency maps with weak supervision. Further, we parameterize the Log-Sum-Exp pooling function with a learnable lower-bounded adaptation (LSE-LBA) to build in a sharpness prior and better handle localizing abnormalities of different sizes using only image-level labels. Applying this approach to interpreting chest x-rays, we set the state of the art on 9 abnormalities in the NIH's CXR14 dataset while generating saliency maps with the highest resolution to date.
研究の動機と目的
- さまざまなサイズの胸部 X 線所見の局在を改善するために、多解像度解析の活用を動機づける。
- ROI アノテーションなしに高解像度の顕著性マップを生成する弱教師ありフレームワークを開発する。
- 変動する病変サイズに対処するための、下限適応を伴う学習可能な Log-Sum-Exp プーリング (LSE-LBA) を導入する。
- NIH Chest X-ray (CXR14) データセットにおける最先端の分類と局在を実証する。
提案手法
- 高解像度と低解像度の特徴を密な接続で融合させる多解像度アーキテクチャを提案する。\n- ResNet ブロックで空間解像度を低下させ、DenseNet風の接続で解像度を保持する。\n- 解像度を跨いで特徴を反復的にアップサンプリングして連結し、局在のための粗から細への表現を形成する。
- 画像レベルのラベルが 2D 顕著性マップ全体の各インスタンス予測を監督する弱教師付き MIL フレームワークを用いる。
- LSE-LBA プーリングを導入: p = (1/(r0+exp(beta))) * log( (1/wh) * sum exp[(r0+exp(beta)) * S_ij] ), ここで r = r0 + exp(beta) が学習可能で下限付きのシャープネスプリオリを提供する。
- sigmoid(WI_n(x)) を適用して各インスタンスのクラス確率を取得し、次に LSE-LBA によってプールして画像レベルの予測を得て、マルチラベル交差エントロピーで学習する。
- NIH Chest X-ray データセットでゼロから訓練を行い、標準的なデータ拡張と Adam 最適化を用いる。異常毎の AUC および局在の連続 Dice を用いて評価する。
実験結果
リサーチクエスチョン
- RQ1多解像度・弱教師あり学習は胸部 X 線で画像レベルのラベルのみから正確な病変の局在を生み出すことができるか。
- RQ2LSE-LBA プーリングはサイズの異なる異常に対して頑健な高解像度の顕著性マップを提供するか。
- RQ3NIH CXR14 における分類性能(AUC)と局在精度(Dice)に対して、多解像度融合はどのような影響を与えるか。
- RQ4様々な病変における局在と分類に対するシャープネスプリオリパラメータ r0 の影響は何か。
主な発見
| 異常 | AUC_r0_0 | AUC_r0_5 | AUC_r0_10 | DICE_r0_0 | DICE_r0_5 | DICE_r0_10 |
|---|---|---|---|---|---|---|
| Atelectasis | 0.7003 | 0.733 | 0.728 | 0.204 | 0.240 | 0.211 |
| Cardiomegaly | 0.8100 | 0.856 | 0.858 | 0.180 | 0.114 | 0.076 |
| Effusion | 0.7585 | 0.806 | 0.803 | 0.293 | 0.294 | 0.242 |
| Infiltration | 0.6614 | 0.673 | 0.675 | 0.325 | 0.312 | 0.286 |
| Nodule | 0.6687 | 0.718 | 0.724 | 0.202 | 0.238 | 0.196 |
| Mass | 0.6933 | 0.777 | 0.777 | 0.295 | 0.295 | 0.241 |
| Pneumonia | 0.6580 | 0.684 | 0.690 | 0.112 | 0.104 | 0.072 |
| Pneumothorax | 0.7993 | 0.805 | 0.791 | 0.039 | 0.023 | 0.028 |
| Consolidation | 0.7032 | 0.711 | 0.714 | - | - | - |
| Edema | 0.8052 | 0.806 | 0.804 | - | - | - |
| Emphysema | 0.8330 | 0.842 | 0.822 | - | - | - |
| Fibrosis | 0.7859 | 0.743 | 0.757 | - | - | - |
| Pleural thickening | 0.6835 | 0.724 | 0.715 | - | - | - |
| Hernia | 0.8717 | 0.775 | 0.764 | 0.824 | - | - |
| A.V.G. | 0.738 | 0.761 | 0.760 | 0.754 | - | - |
- 多くのケースで、Localization ラベルの使用や ImageNet の事前訓練なしで NIH Chest X-ray テストセットの14の異常中9つで最先端または競合的な AUC を達成。
- r0 の増加に伴い、局所性・びまん性の両方の異常で局在が改善される高解像度の確率的顕知性マップを生成。
- 局在性能(Dice)は、適度なシャープネスプリオリ(r0 が約5)で一般的に向上し、びまん性異常では非常に大きい r0 で劣化する可能性がある。
- 分類性能は r0 に対して頑健である一方、局在は r0 により敏感であり、シャープネスとカバレッジのバランスが最良の結果となる。
- 追加のラベルデータなしで、いくつかの異常で従来の弱教師あり手法を上回り、他のケースで最先端に接近する、または追随する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。