Skip to main content
QUICK REVIEW

[论文解读] Fully Convolutional Networks for Dense Semantic Labelling of High-Resolution Aerial Imagery

Jamie Sherrah|arXiv (Cornell University)|Jun 8, 2016
Remote Sensing and LiDAR Applications参考文献 18被引用 270
一句话总结

该论文将全卷积网络(FCN)用于高分辨率航空影像的密集语义标注进行了适配,提出了一个不下采样的 FCN 以保持全分辨率,并在 ISPRS Vaihingen 和 Potsdam 数据集上使用预训练特征和基于 DSM 的混合体素架构取得了最先进的结果。

ABSTRACT

The trend towards higher resolution remote sensing imagery facilitates a transition from land-use classification to object-level scene understanding. Rather than relying purely on spectral content, appearance-based image features come into play. In this work, deep convolutional neural networks (CNNs) are applied to semantic labelling of high-resolution remote sensing data. Recent advances in fully convolutional networks (FCNs) are adapted to overhead data and shown to be as effective as in other domains. A full-resolution labelling is inferred using a deep FCN with no downsampling, obviating the need for deconvolution or interpolation. To make better use of image features, a pre-trained CNN is fine-tuned on remote sensing data in a hybrid network context, resulting in superior results compared to a network trained from scratch. The proposed approach is applied to the problem of labelling high-resolution aerial imagery, where fine boundary detail is important. The dense labelling yields state-of-the-art accuracy for the ISPRS Vaihingen and Potsdam benchmark data sets.

研究动机与目标

  • 证明全卷积网络在高分辨率高空影像的密集语义标注中的有效性。
  • 在不下采样的情况下保持全空间分辨率,以提高边界准确性。
  • 利用预训练的 CNN 特征和高程数据来提升航空数据集的标注性能。

提出的方法

  • 将全连接层转换为卷积层,创建一个作为图像滤波器运行的 FCN。
  • 通过使用空洞(扩张)卷积来扩展感受野,同时不降低分辨率,从而引入无下采样的 FCN。
  • 提出一个混合网络,结合预训练的 CNN 特征与从头训练的 DSM/高程数据。
  • 对小块进行训练以处理大型俯视图像并实现全分辨率输出。
  • 比较基于补丁的训练与 FCN 训练,并分析对边界准确性和训练效率的影响。
  • 在 ISPRS Vaihingen 和 Potsdam 数据集上进行旋转增强并给出排行榜结果。

实验结果

研究问题

  • RQ1FCN 是否能够在不下采样的情况下,对超高分辨率航空影像提供密集的全分辨率语义标注?
  • RQ2相较于传统下采样的 FCN,不下采样的 FCN 是否能改善边界描绘和整体精度?
  • RQ3预训练的可视特征再加上高程/DSM 数据是否能提升航空数据集的语义标注?
  • RQ4数据增强和网络深度对航空影像中 FCN 性能的影响是什么?

主要发现

  • FCN 训练在准确度上显著高于基于补丁的训练(例如 Vaihingen:在36次旋转增强下,总体准确率最高可达 87.17%).
  • 不下采样的 FCN 训练相对于下采样变体带来提升,特别是在汽车类别和边界描绘方面(Vaihingen:汽车 F1/准确率最高可达 66.54%/76.77%)。
  • 将预训练的图像特征与 DSM 特征相结合的混合架构在高分辨率 Potsdam 数据上进一步提升结果(汽车准确率提高;Potsdam 获得提升)。
  • 在 Vaihingen 上,DST_2( RF+CRF) 的无下采样在验证集上达到 87.90% 总体精度,DST_2 在 ISPRS 排名中测试数据达到了 89.1%。
  • 对于 Potsdam,无下采样提高了准确性,汽车类显示显著提升(例如验证集中的 Unknown/Car 指标达到 90.28%)。
  • 与传统的基于插值的恢复相比,无下采样方法减少了边界伪影并在全分辨率下改进像素级标注。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。