[論文レビュー] A Comparative Study of CNN, BoVW and LBP for Classification of Histopathological Images
本稿では、20種類の組織タイプにまたがる960枚の組織病理画像から構成され、公開可能なコンパクトなデータセット「KIMIA Path960」を紹介し、分類のための3つの画像表現手法—LBP、事前学習済みのAlexNetおよびVGG16を用いた深層特徴、BoVW—を比較する。LOO(1人を除いた交差検証)を用いた結果、BoVWが96.50%の最高精度を達成し、LBP(90.62%)および深層特徴(VGG16を用いる際の94.72%)を上回った。
Despite the progress made in the field of medical imaging, it remains a large area of open research, especially due to the variety of imaging modalities and disease-specific characteristics. This paper is a comparative study describing the potential of using local binary patterns (LBP), deep features and the bag-of-visual words (BoVW) scheme for the classification of histopathological images. We introduce a new dataset, \emph{KIMIA Path960}, that contains 960 histopathology images belonging to 20 different classes (different tissue types). We make this dataset publicly available. The small size of the dataset and its inter- and intra-class variability makes it ideal for initial investigations when comparing image descriptors for search and classification in complex medical imaging cases like histopathology. We investigate deep features, LBP histograms and BoVW to classify the images via leave-one-out validation. The accuracy of image classification obtained using LBP was 90.62\% while the highest accuracy using deep features reached 94.72\%. The dictionary approach (BoVW) achieved 96.50\%. Deep solutions may be able to deliver higher accuracies but they need extensive training with a large number of (balanced) image datasets.
研究の動機と目的
- 医療画像解析分野における初期アルゴリズム比較のための、標準的でコンパクトかつ公開可能な組織病理画像データセットの不足に対処すること。
- LBP、深層特徴、BoVWという3つの異なる画像表現手法の性能を、組織病理画像分類の観点から評価・比較すること。
- デジタル病理学分野における初期研究を支援するため、高いクラス間およびクラス内ばらつきを有するベンチマークデータセット(KIMIA Path960)を提供すること。
- 異なる特徴抽出手法における計算複雑性、学習要件、分類精度のトレードオフを評価すること。
提案手法
- 20種類の異なる組織タイプから成る、960枚の組織病理画像から構成される、新規の公開可能な組織病理画像データセット「KIMIA Path960」を提案した。
- 局所的バイナリパターン(LBP)を用いて、低次元でトレーニング不要のテクスチャベースのヒストグラムを抽出した。
- 最終全結合層を特徴ベクトルとして用いることで、事前学習済みの畳み込みニューラルネットワーク(AlexNetおよびVGG16)から深層特徴を抽出した。
- k-meansクラスタリングを用いて視覚的コードブックを構築し、その後SVM(IKSVM)および距離ベース分類器を用いて分類を実行する、Bag-of-Visual-Words(BoVW)フレームワークを実装した。
- BoVWの実験では、画像を256×256および512×512にリサイズし、局所特徴を抽出するために重複ありおよび重複なしのグリッド戦略を用いた。
- すべての手法についてLOO交差検証を実施し、深層特徴およびBoVWの類似度測定に複数の類似度指標(L1、L2、コサイン、χ²)をテストした。
実験結果
リサーチクエスチョン
- RQ1高クラス間およびクラス内ばらつきを有する小規模で多様なデータセットにおいて、LBP、深層特徴、BoVWは組織病理画像分類においてどのように性能を発揮するか?
- RQ2画像解像度およびグリッド戦略(重複あり対重複なし)は、BoVWベースの分類精度にどのような影響を及えるか?
- RQ3微調整なしの事前学習済み深層ネットワークは、小規模で専用の組織病理学データセットにおいても高い性能を達成できるか?
- RQ4BoVWフレームワークにおいて、教師あり分類器(IKSVM)を用いることで、教師なしの距離ベース指標に比べて性能が顕著に向上するか?
- RQ5異なる距離指標(L1、L2、コサイン、χ²)は、深層特徴ベース分類の性能にどのような影響を及えるか?
主な発見
- IKSVMを用いたBoVWアプローチ、特に512×512解像度で96.50%の最高精度を達成し、LBPおよび深層特徴を上回った。
- LBPヒストグラムは90.62%の分類精度を達成し、トレーニング不要かつ低次元であるにもかかわらず、強力な性能を示した。
- VGG16から抽出した深層特徴は94.72%の精度を達成し、AlexNet(91.05%)およびLBPを上回ったが、より多くの計算リソースと学習データを要した。
- 8×8グリッド戦略は16×16戦略を上回った。これは、特にコードブックサイズが大きい場合に、より細かい局所特徴表現が可能だったためである。
- BoVWにおいて、重複ありグリッド戦略は一貫して重複なし戦略を上回った。これは、空間的な重複がコードブックの質を向上させることを示している。
- IKSVM分類器は、BoVWにおいて距離ベース指標を著しく上回った。これは、教師あり学習がクラス固有の意思決定境界を学習できることを示唆している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。