[论文解读] Application of Symmetric Uncertainty and Mutual Information to Dimensionality Reduction and Classification of Hyperspectral Images
本文提出了一种用于高光谱图像(HSI)分类的两阶段基于过滤器的特征选择算法,通过互信息(MI)和对称不确定性(SU)分别控制特征的相关性和冗余性。通过应用MI阈值筛选出具有信息量的波段,并利用SU去除冗余波段,该方法仅使用AVIRIS 92AV3C数据集中的42个波段即实现了84.16%的分类准确率,展示了在降维过程中高效且有效的性能,且在选择阶段无需依赖分类器。
Remote sensing is a technology to acquire data for disatant substances, necessary to construct a model knowledge for applications as classification. Recently Hyperspectral Images (HSI) becomes a high technical tool that the main goal is to classify the point of a region. The HIS is more than a hundred bidirectional measures, called bands (or simply images), of the same region called Ground Truth Map (GT). But some bands are not relevant because they are affected by different atmospheric effects; others contain redundant information; and high dimensionality of HSI features make the accuracy of classification lower. All these bands can be important for some applications; but for the classification a small subset of these is relevant. The problematic related to HSI is the dimensionality reduction. Many studies use mutual information (MI) to select the relevant bands. Others studies use the MI normalized forms, like Symmetric Uncertainty, in medical imagery applications. In this paper we introduce an algorithm based also on MI to select relevant bands and it apply the Symmetric Uncertainty coefficient to control redundancy and increase the accuracy of classification. This algorithm is feature selection tool and a Filter strategy. We establish this study on HSI AVIRIS 92AV3C. This is an effectiveness, and fast scheme to control redundancy.
研究动机与目标
- 解决高光谱图像(HSI)中因高维性和冗余性导致分类准确率下降的问题。
- 开发一种将相关性与冗余性控制分离的特征选择方法,以提升分类性能。
- 采用基于互信息和对称不确定性的过滤策略,避免在特征选择过程中依赖分类器。
- 在真实的AVIRIS 92AV3C数据集上评估该方法,并证明其在减少波段数量的同时保持分类准确率的有效性。
提出的方法
- 该方法使用互信息(MI)计算每个波段与真实标签(GT)图之间的依赖关系,选择MI值高于相关性阈值的波段。
- 采用两步流程:首先,利用相关性阈值(IM)筛选出与GT具有高MI的波段;其次,使用对称不确定性(SU)测量所选波段之间的冗余性。
- 对称不确定性(SU)被用作波段对之间冗余性的归一化、对称度量,通过设定阈值(TH)以剔除高度冗余的波段。
- 该算法通过迭代方式移除与已选波段SU值较高的波段,确保最终子集的冗余性较低。
- 最终选定的波段子集用于分类,性能通过在AVIRIS 92AV3C数据集上的准确率进行评估。
- 该方法设计为过滤策略,即在特征选择过程中不调用任何分类器,从而实现快速、可扩展的应用。
实验结果
研究问题
- RQ1与现有方法相比,一种将相关性与冗余性选择解耦的两阶段基于过滤器的方法是否能提升HSI分类准确率?
- RQ2对称不确定性在检测和消除高光谱数据中冗余波段方面的有效性如何?
- RQ3为在最小波段数下最大化分类准确率,相关性(IM)与冗余性(TH)阈值的最佳组合是什么?
- RQ4该方法在真实HSI数据(如AVIRIS 92AV3C)上能将维度降低到何种程度,同时仍保持分类性能?
- RQ5由于其基于过滤器且非迭代的特性,该方法是否可高效应用于实时系统?
主要发现
- 所提方法仅使用AVIRIS 92AV3C数据集中的42个波段即实现了84.16%的分类准确率,证明了其高效性。
- 在19个波段和最优阈值设置下,该方法达到了80%的分类准确率,表明其在低维情况下的优异性能。
- 该方法有效控制了相关性与冗余性,其中Zone 4(TH=0.56, IM=0.9)在准确率与波段数量之间实现了最佳平衡。
- 使用所选波段重建的真实标签图与原始图高度一致,表明具有良好的泛化能力和信息保留能力。
- 通过与原始数据和合成数据的可视化及定量对比,证实该算法在保留信息波段的同时显著降低了冗余性。
- 由于其快速的过滤器设计且无需重复调用分类器,该方法适用于实时应用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。