[论文解读] Fully Convolutional Networks for Dense Semantic Labelling of High-Resolution Aerial Imagery
该论文将全卷积网络(FCN)用于高分辨率航空影像的密集语义标注进行了适配,提出了一个不下采样的 FCN 以保持全分辨率,并在 ISPRS Vaihingen 和 Potsdam 数据集上使用预训练特征和基于 DSM 的混合体素架构取得了最先进的结果。
The trend towards higher resolution remote sensing imagery facilitates a transition from land-use classification to object-level scene understanding. Rather than relying purely on spectral content, appearance-based image features come into play. In this work, deep convolutional neural networks (CNNs) are applied to semantic labelling of high-resolution remote sensing data. Recent advances in fully convolutional networks (FCNs) are adapted to overhead data and shown to be as effective as in other domains. A full-resolution labelling is inferred using a deep FCN with no downsampling, obviating the need for deconvolution or interpolation. To make better use of image features, a pre-trained CNN is fine-tuned on remote sensing data in a hybrid network context, resulting in superior results compared to a network trained from scratch. The proposed approach is applied to the problem of labelling high-resolution aerial imagery, where fine boundary detail is important. The dense labelling yields state-of-the-art accuracy for the ISPRS Vaihingen and Potsdam benchmark data sets.
研究动机与目标
- 证明全卷积网络在高分辨率高空影像的密集语义标注中的有效性。
- 在不下采样的情况下保持全空间分辨率,以提高边界准确性。
- 利用预训练的 CNN 特征和高程数据来提升航空数据集的标注性能。
提出的方法
- 将全连接层转换为卷积层,创建一个作为图像滤波器运行的 FCN。
- 通过使用空洞(扩张)卷积来扩展感受野,同时不降低分辨率,从而引入无下采样的 FCN。
- 提出一个混合网络,结合预训练的 CNN 特征与从头训练的 DSM/高程数据。
- 对小块进行训练以处理大型俯视图像并实现全分辨率输出。
- 比较基于补丁的训练与 FCN 训练,并分析对边界准确性和训练效率的影响。
- 在 ISPRS Vaihingen 和 Potsdam 数据集上进行旋转增强并给出排行榜结果。
实验结果
研究问题
- RQ1FCN 是否能够在不下采样的情况下,对超高分辨率航空影像提供密集的全分辨率语义标注?
- RQ2相较于传统下采样的 FCN,不下采样的 FCN 是否能改善边界描绘和整体精度?
- RQ3预训练的可视特征再加上高程/DSM 数据是否能提升航空数据集的语义标注?
- RQ4数据增强和网络深度对航空影像中 FCN 性能的影响是什么?
主要发现
- FCN 训练在准确度上显著高于基于补丁的训练(例如 Vaihingen:在36次旋转增强下,总体准确率最高可达 87.17%).
- 不下采样的 FCN 训练相对于下采样变体带来提升,特别是在汽车类别和边界描绘方面(Vaihingen:汽车 F1/准确率最高可达 66.54%/76.77%)。
- 将预训练的图像特征与 DSM 特征相结合的混合架构在高分辨率 Potsdam 数据上进一步提升结果(汽车准确率提高;Potsdam 获得提升)。
- 在 Vaihingen 上,DST_2( RF+CRF) 的无下采样在验证集上达到 87.90% 总体精度,DST_2 在 ISPRS 排名中测试数据达到了 89.1%。
- 对于 Potsdam,无下采样提高了准确性,汽车类显示显著提升(例如验证集中的 Unknown/Car 指标达到 90.28%)。
- 与传统的基于插值的恢复相比,无下采样方法减少了边界伪影并在全分辨率下改进像素级标注。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。