QUICK REVIEW

[論文レビュー] A Consensual Collaborative Learning Method for Remote Sensing Image Classification Under Noisy Multi-Labels

Ahmet Aksoy, Mahdyar Ravanbakhsh|arXiv (Cornell University)|May 12, 2021

Text and Document Classification Technologies参考文献 21被引用数 11

ひとこと要約

本稿では、リモートセンシング画像分類におけるノイズの多いマルチラベルアノテーションに対処するため、共感的協調マルチラベル学習（CCML）手法を提案する。特徴の多様性を確保するための差分モジュール、不確実性推定のためのグループラasso、ラベル補正のためのフリッピングモジュール、順位交換のためのスワップモジュールを活用することで、CCMLは誤りおよび欠落したラベルを自動的に同定・補正し、ResNetおよびDenseNetバックボーンを用いた高合成ノイズ率（最大50％）において最先端の性能を達成する。

ABSTRACT

Collecting a large number of reliable training images annotated by multiple land-cover class labels in the framework of multi-label classification is time-consuming and costly in remote sensing (RS). To address this problem, publicly available thematic products are often used for annotating RS images with zero-labeling-cost. However, such an approach may result in constructing a training set with noisy multi-labels, distorting the learning process. To address this problem, we propose a Consensual Collaborative Multi-Label Learning (CCML) method. The proposed CCML identifies, ranks and corrects training images with noisy multi-labels through four main modules: 1) discrepancy module; 2) group lasso module; 3) flipping module; and 4) swap module. The discrepancy module ensures that the two networks learn diverse features, while obtaining the same predictions. The group lasso module detects the potentially noisy labels by estimating the label uncertainty based on the aggregation of two collaborative networks. The flipping module corrects the identified noisy labels, whereas the swap module exchanges the ranking information between the two networks. The experimental results confirm the success of the proposed CCML under high (synthetically added) multi-label noise rates. The code of the proposed method is publicly available at https://noisy-labels-in-rs.org

研究の動機と目的

テーマ製品（CLC や GlobCover など）を用いたゼロコストラベリングの際、生じるノイズの多いマルチラベルアノテーションの課題に対処すること。
ノイズの種類に関する事前仮定なしに、誤ったラベルおよび欠落したラベルを検出・補正する手法を開発すること。
高ラベルノイズ下でもマルチラベル分類性能を向上させる、アーキテクチャに依存しない堅牢なフレームワークを構築すること。
マルチラベルリモートセンシング応用におけるディープラーニングモデルに及ぼすアレアトリック不確実性（ラベルノイズ）の悪影響を低減すること。

提案手法

CCMLフレームワークは、共通パラメータを持つ2つの同一のCNN（f と g）を用い、差分モジュールにより特徴の多様性を確保すると同時に、一貫性を保つ予測を実現する。
差分モジュールは、中間層特徴間の最大平均差分（MMD）損失により特徴の多様性を強制し、一貫性損失により類似した最終予測を保証する。
グループラassoモジュールは、両ネットワークからの予測を集約した上で、サンプルごとの順位損失を計算することでラベルの不確実性を推定し、ノイズラベルの同定を可能にする。
フリッピングモジュールは、高い不確実性を示すラベルに対して予測を反転させることで補正を行う。一方、スワップモジュールは順位情報を交換し、極めてノイズの高いサンプルをバックプロパゲーションから除外する。
本手法は、バイナリクロスエントロピー損失、一貫性損失、乖離損失をバランスさせる結合損失関数を用いて学習され、学習可能パラメータ λ1 と λ2 を有する。
本アプローチはアーキテクチャに依存せず、ResNet や DenseNet などのさまざまなバックボーンネットワークに統合可能である。

実験結果

リサーチクエスチョン

RQ1ノイズの種類に関する事前仮定なしに、協調学習フレームワークが、リモートセンシング画像における誤ったおよび欠落したマルチラベルアノテーションを効果的に検出・補正できるか。
RQ2標準的なディープラーニングベースラインと比較して、本手法CCMLは高合成ラベルノイズ率（例：40–50％）下でどのように性能を発揮するか。
RQ3差分モジュール、グループラasso、フリッピング、スワップといった個々のモジュールが、CCML全体の性能にどの程度寄与しているか。
RQ4リモートセンシング画像分類において、ノイズの高い学習条件下でも、CCMLはResNet や DenseNet といった異なるバックボーンアーキテクチャに対して同等の堅牢性を示すか。

主な発見

50％の注入ノイズ率下で、ResNetバックボーンを用いたCCMLは、ベースラインのResNetモデルと比較して、精度が25％向上し、F1スコアが10％向上した。
DenseNetバックボーンを用いた場合、50％のノイズ率下でCCMLは精度で30％、F1スコアで15％の改善を達成し、アーキテクチャを問わず高い堅牢性を示した。
低学習サンプル数（例：「モールズ、ヘイスランドおよびスクラロフィル植物」）を有するクラスに対しても、CCMLは高い性能を維持し、ベースラインを上回った。
差分モジュールとスワップモジュールは根本的役割を果たしており、差分モジュールを削除すると、特徴表現の多様性を学習できず、協調学習の原則が損なわれた。
グループラassoモジュールは、異なるノイズタイプを個別に同定するために不可欠であり、その削除により性能が著しく低下した。
フリッピングモジュールは遅延効果を示したが、その削除により性能が著しく低下しなかったことから、トレーニングにおけるタイミングに頑健であることが示唆された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。