QUICK REVIEW

[論文レビュー] Results of the 2020 fastMRI Challenge for Machine Learning MR Image Reconstruction

Matthew J. Muckley, Bruno Riemenschneider|arXiv (Cornell University)|Dec 9, 2020

Radiomics and Machine Learning in Medical Imaging被引用数 29

ひとこと要約

本論文は、7,299件の匿名化された頭部MRI画像から得られた部分的k空間データを用いた機械学習コンペティションである2020 fastMRIチャレンジの結果を提示する。チャレンジでは、異なるメーカー間での一般化性を評価するための新しい「トランスファー」トラックを導入し、画像病変の描写に関する放射線科医の評価を重視した。その結果、SSIMスコアと臨床的評価の両面で優れた性能を示す最先端のモデルが得られた。

ABSTRACT

Accelerating MRI scans is one of the principal outstanding problems in the MRI research community. Towards this goal, we hosted the second fastMRI competition targeted towards reconstructing MR images with subsampled k-space data. We provided participants with data from 7,299 clinical brain scans (de-identified via a HIPAA-compliant procedure by NYU Langone Health), holding back the fully-sampled data from 894 of these scans for challenge evaluation purposes. In contrast to the 2019 challenge, we focused our radiologist evaluations on pathological assessment in brain images. We also debuted a new Transfer track that required participants to submit models evaluated on MRI scanners from outside the training set. We received 19 submissions from eight different groups. Results showed one team scoring best in both SSIM scores and qualitative radiologist evaluations. We also performed analysis on alternative metrics to mitigate the effects of background noise and collected feedback from the participants to inform future challenges. Lastly, we identify common failure modes across the submissions, highlighting areas of need for future research in the MRI reconstruction community.

研究の動機と目的

機械学習を用いた画像再構成により、MRIスキャンの高速化を実現し、臨床的ニーズに応える。
異なるMRIスキャナーメーカーや施設間でのモデル一般化性を向上させ、臨床応用の障壁となる要因を解消する。
評価の臨床的妥当性を高めるため、全体的な画像品質から病変の描写に焦点を当てた放射線科医による評価へ移行する。
再現性のある研究を可能とするため、マルチコイルで部分的にサンプリングされたk空間データを含む大規模な公開データセットを提供する。
現在の評価指標やモデル挙動における限界、たとえば「幻覚」やノイズへの感受性を特定し、今後の手法開発の指針とする。

提案手法

7,299件の臨床的頭部MRIスキャンから、擬似等間隔サンプリングマスクを用いて完全にスキャンされたk空間データを後向きに部分的にサンプリングし、正確に4倍および8倍の加速率を達成した。
参加者に高い性能基準を設定するため、エンドツーエンド可変ネットワークに基づく強力なベースラインモデルを採用した。
トレーニングデータに含まれないMRIスキャナーメーカーのデータでモデルを評価する必要がある「トランスファー」トラックを新設し、メーカー間一般化性をテストした。
並列画像再構成および圧縮センシング手法のための自己キャリブレーションを可能にするために、k空間の中心部を完全に保持した。
定量的評価としてSSIMを、定性的評価として病変構造の可視性に焦点を当てた放射線科医による画像読影を実施した。
参加者からのフィードバックを収集し、特に計算リソースの要請とサンプリングパターンの現実性に関する今後のチャレンジ設計の改善に活用した。

実験結果

リサーチクエスチョン

RQ1マルチコイルで単一メーカーのデータに学習させた機械学習モデルは、トレーニングデータに含まれないMRIスキャナーメーカーのデータに対しても効果的に一般化できるか？
RQ2全体的な画像品質ではなく、病変の描写に焦点を当てた放射線科医の評価が、モデルランク付けと臨床的関連性にどのように影響するか？
RQ3ノイズやアーチファクトが存在する状況において、SSIM や RSS といった現在の指標が、臨床的に重要な画像品質を十分に捉えていない程度はどの程度か？
RQ4深層学習ベースのMRI再構成モデルにおける一般的な失敗モードは何か、特に高加速率下で顕在するか？
RQ5幻覚のリスクを低減し、臨床的画像解釈と整合性を保つために、評価プロトコルをどのように改善できるか？

主な発見

1チームがSSIMスコアと放射線科医評価の両方で最高の性能を達成し、8倍加速下でのMRI再構成分野で新たな最先端水準を確立した。
トランスファートラックでは、分布外のスキャナーメーカーのデータで顕著な性能低下が確認され、臨床応用におけるメーカー間一般化性の難しさが浮き彫りになった。
放射線科医は8倍加速およびトランスファートラックの画像に対して混合した評価を示し、病変の描写が依然として困難で未解決の研究分野であることが示された。
参加者からは、チャレンジで使用された擬似等間隔サンプリングマスクが実際のベンダーシーケンスを完全に再現していないと報告され、臨床応用に向けたさらなるファインチューニングの必要性が示唆された。
参加者の多くが、最先端モデルのトレーニングにかかる高い計算コストについて懸念を示しており、一部の参加者は単一GPUでのみトレーニングを行ったと報告しており、学術研究者にとっての参入障壁となっていることが明らかになった。
フィードバックから、SSIMは滑らかさを好む傾向があり、診断的詳細を重視する放射線科医の好みと矛盾する可能性があることが判明し、人間の知覚と臨床的ニーズに適合した新たな評価指標の開発が求められている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。