Skip to main content
QUICK REVIEW

[论文解读] Decentralised Semi-supervised Onboard Learning for Scene Classification in Low-Earth Orbit

Johan Östman, Pablo Gómez|arXiv (Cornell University)|May 6, 2023
Satellite Communication Systems被引用 8
一句话总结

论文展示了在卫星星座中进行去中心化和联邦半监督的机载学习用于场景分类,在符合 PASEOS 模型的运营约束下,在 EuroSAT 数据集上约 24 小时内达到约 91% 的准确率。

ABSTRACT

Onboard machine learning on the latest satellite hardware offers the potential for significant savings in communication and operational costs. We showcase the training of a machine learning model on a satellite constellation for scene classification using semi-supervised learning while accounting for operational constraints such as temperature and limited power budgets based on satellite processor benchmarks of the neural network. We evaluate mission scenarios employing both decentralised and federated learning approaches. All scenarios achieve convergence to high accuracy (around 91% on EuroSAT RGB dataset) within a one-day mission timeframe.

研究动机与目标

  • 在功率、温度和通信约束下研究在卫星星座上机载训练场景分类模型的可行性。
  • 评估去中心化和联邦 MSMatch 方法在有限标注数据下的半监督学习效果。
  • 量化在不同通信架构下的数据传输和能量权衡与性能表现。
  • 使用现实任务仿真评估当前卫星处理器的机载训练可行性。

提出的方法

  • 使用 MSMatch 半监督学习,结合强/弱数据增广和伪标签。
  • 用 PASEOS 建模操作约束,仿真功率、热与通信窗口。
  • 为分布式训练改造 MSMatch,使用 MPI 实现异步模型交换。
  • 在 Sentinel 类轨道中评估三种通信设置(地面站、群星、中继)。
  • 在 24 小时的仿真运行中测量准确率、传输数据与功耗。

实验结果

研究问题

  • RQ1基于 MSMatch 的半监督学习能否在去中心化的机载环境中有效训练?
  • RQ2不同星间通信架构如何影响收敛性、准确性与资源使用?
  • RQ3在现实约束下将未标注数据分配到各卫星时的数据和功率权衡是什么?
  • RQ4在类似数据规模下,机载训练是否能够达到与集中式 MSMatch 相当的性能?

主要发现

SetupAccuracy [%]Transmitted Data [MB]Power Consumption [Wh]Time Training [% of total]Time Communicating [% of total]time between communications [s]
GROUND STATION91.51 ±0.95185.74447.5854.251.715913.6
SWARM90.96±1.341168.40449.3653.763.341878.4
RELAY91.19±0.76455.61449.3754.451.322349.3
  • 所有情景在 24 小时的仿真训练内都达到顶级准确率(top-1)超过 91%。
  • 地面站(Ground Station)设置在三种方案中传输数据最少,达到 91.51% 准确率,传输数据最少(185.74 MB)且数据交换最少。
  • 群星(Swarm)设置数据交换量最大(1168.40 MB),局部收敛最快,但通信代价最高。
  • 中继(Relay)设置在中等数据传输量(455.61 MB)下实现 91.19% 的准确率,总通信时间也较低。
  • 标注集规模增大可提升 SWARM 的性能,在每类 100 个标签时达到顶级准确率 96.2%。
  • 分布式 MSMatch 在与集中式 MSMatch 相当的数据规模下性能具有竞争力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。