Skip to main content
QUICK REVIEW

[论文解读] SSL4EO-S12: A Large-Scale Multi-Modal, Multi-Temporal Dataset for Self-Supervised Learning in Earth Observation

Yi Wang, Nassim Ait Ali Braham|arXiv (Cornell University)|Nov 13, 2022
Advanced Image and Video Retrieval Techniques被引用 25
一句话总结

作者发布 SSL4EO-S12,这是一个全球性的、多模态的多时相未标注地球观测数据集(Sentinel-1/2),用于自监督预训练,并展示其在多种 SSL 方法和下游遥感任务上的有效性。

ABSTRACT

Self-supervised pre-training bears potential to generate expressive representations without human annotation. Most pre-training in Earth observation (EO) are based on ImageNet or medium-size, labeled remote sensing (RS) datasets. We share an unlabeled RS dataset SSL4EO-S12 (Self-Supervised Learning for Earth Observation - Sentinel-1/2) to assemble a large-scale, global, multimodal, and multi-seasonal corpus of satellite imagery from the ESA Sentinel-1 \& -2 satellite missions. For EO applications we demonstrate SSL4EO-S12 to succeed in self-supervised pre-training for a set of methods: MoCo-v2, DINO, MAE, and data2vec. Resulting models yield downstream performance close to, or surpassing accuracy measures of supervised learning. In addition, pre-training on SSL4EO-S12 excels compared to existing datasets. We make openly available the dataset, related source code, and pre-trained models at https://github.com/zhu-xlab/SSL4EO-S12.

研究动机与目标

  • 推动地球观测的自监督预训练,克服对 ImageNet- 类数据和小型 RS 数据集的依赖。
  • 组装一个全球性的、多模态、跨四季的 EO 语料库(Sentinel-1/2),具有四个季节快照且没有重叠的小块。
  • 在多样的下游 RS 任务上评估代表性的 SSL 方法,以建立可迁移性和基准性能。
  • 展示 RS 特定的数据增强(多传感器、多时相、大气校正),提升 SSL 的收益。

提出的方法

  • 通过抽样 251,079 个全球位置并在四个季节收集 Sentinel-1 SAR 和 Sentinel-2 光学数据 (L1C/L2A),实现重叠不显著的覆盖。
  • 在 SSL4EO-S12 数据上对四种 SSL 方法进行预训练(MoCo-v2/v3、DINO、MAE、data2vec),以 Sentinel-2 L1C 作为默认输入。
  • 使用 Multi-Temporal RandomSeasonContrast 来利用季节变化进行 MoCo 和 DINO 的对比;为 MAE 和 data2vec 的每个补丁分配一个随机季节。
  • 通过线性探针和微调在 EuroSAT、BigEarthNet、So2Sat-LCZ42(场景分类)上评估对下游任务的迁移;在 DFC2020 和 OSCD(分割/变化检测)上评估。
  • 对多模态性、季节信息、大气校正和预训练规模进行消融分析,以评估影响。

实验结果

研究问题

  • RQ1在全球性、多模态、多时相的 EO 数据集上进行大规模 SSL 预训练,对下游 RS 任务有多大的有效性?
  • RQ2RS 特定的数据增强(多传感器、多时相、大气校正)是否提升 SSL 迁移性能?
  • RQ3在线性探针和微调方面,SSL4EO-S12 与其他 RS 预训练数据集(如 SEN12MS、SeCo、ImageNet)相比如何?
  • RQ4训练数据规模对下游性能和饱和行为有什么影响?
  • RQ5多模态(S1+S2)预训练相对于单模态预训练带来哪些好处?

主要发现

  • SSL4EO-S12 使多种 SSL 方法(MoCo-v2、DINO、MAE、data2vec)的自监督预训练变得有效。
  • 在 SSL4EO-S12 上进行预训练,在若干任务上提升了下游性能,相对于现有的 RS 预训练数据集。
  • RS 特定的数据增强(包括多传感器、多时相和大气校正)在迁移性能上带来显著提升。
  • 多模态预训练(S1+S2)在下游 BigEarthNet 及相关数据集上提供了对单模态的额外提升。
  • 在标签有限的情况下进行微调,受益于 SSL4EO-S12 预训练,有时甚至超过拥有更多标签的全监督模型。
  • 随着预训练数据量增加,性能提升出现可观察到的饱和,受模型规模影响。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。