QUICK REVIEW

[論文レビュー] A New Cervical Cytology Dataset for Nucleus Detection and Image Classification (Cervix93) and Methods for Cervical Nucleus Detection

Hady Ahmady Phoulady, Peter R. Mouton|arXiv (Cornell University)|Nov 23, 2018

Cervical Cancer and HPV Research参考文献 8被引用数 30

ひとこと要約

本稿では、Cervix93を紹介する。これは、ThinPrepスライドから得られた93枚の実際の画像スタックから構成され、Negative、LSIL、HSILに分類されたもので、手動でアノテートされた核が2,705個含まれる、公開可能な新しい子宮頸がん細胞診画像データセットである。本稿ではベースライン手法と畳み込みニューラルネットワーク（CNN）を用いた核検出手法を提案し、両者とも従来の最先端手法を上回る性能を示した。特にCNNはF1スコア0.878を達成し、より困難な実画像データセットにおいて、ベースライン手法および既存手法を顕著に上回った。

ABSTRACT

Analyzing Pap cytology slides is an important tasks in detecting and grading precancerous and cancerous cervical cancer stages. Processing cytology images usually involve segmenting nuclei and overlapping cells. We introduce a cervical cytology dataset that can be used to evaluate nucleus detection, as well as image classification methods in the cytology image processing area. This dataset contains 93 real image stacks with their grade labels and manually annotated nuclei within images. We also present two methods: a baseline method based on a previously proposed approach, and a deep learning method, and compare their results with other state-of-the-art methods. Both the baseline method and the deep learning method outperform other state-of-the-art methods by significant margins. Along with the dataset, we publicly make the evaluation code and the baseline method available to download for further benchmarking.

研究の動機と目的

核検出および分節化の評価に向けた包括的で現実世界のデータセットが不足しているという問題に取り組む。
日常臨床での細胞診画像が示す多様性と複雑さを反映する、新しいデータセットの開発およびベンチマーク化。
従来の最先端手法を上回る性能を示すベースライン手法および深層学習アプローチの提案と評価。
核の形態および立体計測パラメータに基づく、自動細胞診画像分類の今後の研究を可能にする。
将来的な細胞全体の分節評価を支援するため、胞質および核境界のアノテーションを含むデータセット構築の基盤を築く。

提案手法

データセットは、ThinPrepパップ染色スライドから得られた93枚の実際の拡大焦点深度（EDF）画像から構成され、ハードウェア・ソフトウェア統合型顕微鏡システムを用いた体系的・ランダムな手法により取得された。
各画像スタックには、40倍拡大での10～20フレームが含まれており、EDF再構成処理を適用して1枚の合焦画像を1スライドあたり生成した。
核は細胞診技師によって手動でアノテートされ、各核の中心に点がマークされた。核の半分以上がフレーム内に収まり、中心が境界から少なくとも10ピクセル以上離れていることを保証した。
トレーニング／テスト分割が作成され、各グレード分類（N、LSIL、HSIL）の約25％のフレームがテストセットに割り当てられ、ラベルはCSVファイルに保存された。
以前に発表された手法に基づくベースライン手法が実装され、評価された。この手法では、形状的および強度に基づく特徴量を用いて核検出を実施した。
畳み込みニューラルネットワーク（CNN）を本データセットでトレーニングおよびテストし、同じトレーニング／テストパーティションを用いた。性能評価には、正確性（precision）、再現率（recall）、F1スコアを用いた。

実験結果

リサーチクエスチョン

RQ1従来の核検出手法の性能は、現実世界の多様性が著しい子宮頸がん細胞診画像データセットにどの程度一般化されるか？
RQ2より現実的で画像のばらつきが大きく、より多くのアノテート済み核を含む新しいデータセットは、核検出アルゴリズムのベンチマーク評価をどのように改善できるか？
RQ3深層学習アプローチは、この新しいデータセットにおいて、従来の手作業による特徴量ベースの手法をどの程度上回ることができるか？
RQ4実際の細胞診画像において、異なるパップ染色グレード（Negative、LSIL、HSIL）における核検出手法の正確性と再現率はどのように変動するか？
RQ5画像のばらつきや核の重なりが、核検出モデルの性能にどのような影響を及えるか？

主な発見

提案されたCNN手法はF1スコア0.878を達成し、ベースライン手法（F1 = 0.820）および評価されたすべての他の最先端手法を顕著に上回った。
ベースライン手法は正確性0.803、再現率0.838を達成し、ISBI 2014および2015チャレンジで報告されたLuらおよびUshizimaらの手法を上回った。
Phouladyら[13]の手法はF1スコア0.734を記録し、これはベースラインおよびCNN手法より低く、より複雑なこのデータセットへの一般化能力が低いことを示した。
CNNモデルは約10％の核を見逃しており、主に核の重なりや画像端縁付近の核に起因すると考えられ、高度な後処理によりさらなる改善が可能である。
この実画像で高ばらつきを示すデータセットは、従来のISBIデータセットよりもはるかに困難であることが、過去の最先端手法の性能低下から明らかになった。
結果から、臨床的サンプルにおける実画像のばらつきや複雑な核形態は、合成的または低ばらつきのデータセットを用いた過去のベンチマークと比較して、はるかに大きな課題をもたらすことが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。