QUICK REVIEW

[論文レビュー] A Deep-Learning Algorithm for Thyroid Malignancy Prediction From Whole Slide Cytopathology Images.

David Dov, Shahar Z. Kovalsky|arXiv (Cornell University)|May 2, 2019

AI in cancer detection被引用数 6

ひとこと要約

本論文は、全スライド画像（WSI）からの甲状腺悪性腫瘍予測のための新規2段階ディープラーニング手法を提案する。この手法は、最大尤度推定（MLE）フレームワークに基づき、袋レベルの悪性度、診断スコア、およびインスタンスレベルの有用性と異常度という複数のラベルタイプを統合的に活用する。弱い教師あり学習戦略に基づくMLE下界の導出により、インスタンス同定の向上と局所スコアのグローバル予測への統合を実現し、人間の病理医と同等の性能を達成する。

ABSTRACT

We consider machine-learning-based thyroid-malignancy prediction from cytopathology whole-slide images (WSI). Multiple instance learning (MIL) approaches, typically used for the analysis of WSIs, divide the image (bag) into patches (instances), which are used to predict a single bag-level label. These approaches perform poorly in cytopathology slides due to a unique bag structure: sparsely located informative instances with varying characteristics of abnormality. We address these challenges by considering multiple types of labels: bag-level malignancy and ordered diagnostic scores, as well as instance-level informativeness and abnormality labels. We study their contribution beyond the MIL setting by proposing a maximum likelihood estimation (MLE) framework, from which we derive a two-stage deep-learning-based algorithm. The algorithm identifies informative instances and assigns them local malignancy scores that are incorporated into a global malignancy prediction. We derive a lower bound of the MLE, leading to an improved training strategy based on weak supervision, that we motivate through statistical analysis. The lower bound further allows us to extend the proposed algorithm to simultaneously predict multiple bag and instance-level labels from a single output of a neural network. Experimental results demonstrate that the proposed algorithm provides competitive performance compared to several competing methods, achieves (expert) human-level performance, and allows augmentation of human decisions.

研究の動機と目的

細胞病理学的WSIにおける標準的な複数インスタンス学習（MIL）の限界を是正する。特に、有用なインスタンスが希少かつ多様性に富んでいる場合に有効である。
袋レベルのラベルに加え、順序付き診断スコアおよびインスタンスレベルの有用性・異常度のラベルを統合することで、悪性度予測を向上させる。
最大尤度推定（MLE）の下界を導出することで、弱教師あり学習戦略を構築し、完全なラベルが得られない場合やノイズが混在する場合でも、モデルの学習を効果的に向上させる。
1つのニューラルネットワーク出力により、同時に袋レベルの悪性度とインスタンスレベルの属性を予測可能にする。
全スライド画像からの甲状腺悪性腫瘍分類において、専門的病理医と同等の性能を達成する。

提案手法

本手法は2段階のディープラーニングフレームワークを導入する。まずWSI（袋）内に有用なパッチ（インスタンス）を同定し、次にそれらに局所的悪性度スコアを割り当てる。
袋レベルの悪性度、インスタンスレベルの有用性、異常度、および順序付き診断スコアをラベルとして含む最大尤度推定（MLE）フレームワークを用いて学習問題を定式化する。
弱教師あり学習を可能にするために、MLEの下界を導出する。これにより、完全な監視情報が得られない状況でも、モデルの効果的かつ安定した学習が可能になる。
1つのニューラルネットワーク出力を共有することで、グローバルな悪性度とローカルなインスタンス属性の両方を同時に予測可能にする。
アテンションメカニズムまたは類似のメカニズムを用いて、予測された有用性と異常度に基づき、有用なインスタンスを同定・重み付けする。
導出されたMLE下界に基づく最適化により、弱教師あり学習下でもモデルのロバスト性と収束性が向上する。

実験結果

リサーチクエスチョン

RQ1袋レベルの悪性度、診断スコア、およびインスタンスレベルの有用性・異常度といった複数のラベルタイプを統合することで、標準的なMILを上回る甲状腺悪性腫瘍予測性能が向上するか？
RQ2導出された下界を有する最大尤度推定（MLE）フレームワークは、この文脈における弱教師あり学習をどのように向上させるか？
RQ31回の順伝播で、袋レベルとインスタンスレベルの両方のラベルを同時に予測できる深層学習モデルの限界はどの程度か？
RQ4提案手法は、全スライド画像からの甲状腺悪性腫瘍分類において、専門的病理医と同等の性能を達成するか？
RQ5モデルが有用なインスタンスを同定・スコア化する能力が、グローバルな悪性度予測の向上にどのように寄与するか？

主な発見

提案手法は、全スライド画像からの甲状腺悪性腫瘍予測において、複数の最先端手法と比較して競争力のある性能を達成する。
モデルは人間の病理医と同等の性能に達し、悪性腫瘍分類における専門的病理医の正確性を模倣していることを示している。
インスタンスレベルの有用性と異常度ラベルの統合は、WSI内での関連領域同定を顕著に向上させる。
MLE下界に基づく弱教師あり学習戦略は、より安定的かつ効果的なモデル最適化をもたらす。
本手法は、統一されたネットワークアーキテクチャを用いて、1回の順伝播でグローバルな悪性度とローカルなインスタンス属性の両方を同時に予測可能である。
モデルが有用なパッチに局所的悪性度スコアを割り当てる能力は、解釈可能性を高め、人間の診断意思決定を支援する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。