[论文解读] U-Net with Hadamard Transform and DCT Latent Spaces for Next-day Wildfire Spread Prediction
本文提出 Transform Domain Fusion UNet (TD-FusionUNet),一种轻量级的变换域 UNet,使用可训练的 Hadamard 和 DCT 层,在多模态卫星数据下预测次日野火蔓延,参数显著减少的情况下达到最先进的精度。
We developed a lightweight and computationally efficient tool for next-day wildfire spread prediction using multimodal satellite data as input. The deep learning model, which we call Transform Domain Fusion UNet (TD-FusionUNet), incorporates trainable Hadamard Transform and Discrete Cosine Transform layers that apply two-dimensional transforms, enabling the network to capture essential "frequency" components in orthogonalized latent spaces. Additionally, we introduce custom preprocessing techniques, including random margin cropping and a Gaussian mixture model, to enrich the representation of the sparse pre-fire masks and enhance the model's generalization capability. The TD-FusionUNet is evaluated on two datasets which are the Next-Day Wildfire Spread dataset released by Google Research in 2023, and WildfireSpreadTS dataset. Our proposed TD-FusionUNet achieves an F1 score of 0.591 with 370k parameters, outperforming the UNet baseline using ResNet18 as the encoder reported in the WildfireSpreadTS dataset while using substantially fewer parameters. These results show that the proposed latent space fusion model balances accuracy and efficiency under a lightweight setting, making it suitable for real time wildfire prediction applications in resource limited environments.
研究动机与目标
- 推动实现精准的次日野火蔓延预测,以优化资源分配和应急响应。
- 开发一个轻量级、变换域神经网络,捕捉稀疏野火掩模的频域特征。
- 通过自定义预处理来丰富训练数据,解决火灾前掩模的稀疏性和不平衡性问题。
- 展示低参数量和计算效率带来的边缘部署潜力。
提出的方法
- 引入 HT-perceptron 模块,应用 2D Hadamard 变换、可训练的通道尺度调整与软阈值处理,然后进行逆 Hadamard 重构。
- 扩展为双分支结构(TD-FusionUNet),通过融合层将 Hadamard 域特征与 DCT 域特征进行融合。
- 在并行分支中加入 2D DCT-perceptron 模块,在解码阶段融合 HT 与 DCT 特征。
- 应用两种自定义预处理技术——随机边缘裁剪和高斯混合平滑,以缓解稀疏性并提升泛化能力。
- 在 Google Research Next-Day Wildfire Spread 和 WildfireSpreadTS 数据集上进行评估,并与 UNet 基线及轻量化变体进行对比。

实验结果
研究问题
- RQ1变换域学习是否通过 Hadamard 与 DCT 层在保持轻量化模型的同时提升次日野火蔓延预测?
- RQ2双分支变换域融合(HT + DCT)是否在稀疏数据条件下优于单分支变换域 UNet 与传统 UNet?
- RQ3自定义预处理技术是否提升模型在稀疏的前火掩模上的泛化能力?
- RQ4TD-FusionUNet 是否适合边缘部署,并在参数显著减少的情况下仍保持竞争力的精度?
主要发现
- 以 base 通道宽度 8 的 TD-FusionUNet 在 WildfireSpreadTS 上取得最佳 F1 0.591,参数为 370k,超过基于 ResNet18 的 UNet 基线。
- 单分支 HT-UNet 相较于 CNN 自编码器基线在参数减少超过 50% 的同时,在标准预处理和自定义预处理下均提升 IoU 与 F1。
- HT 基与 DCT 基的变换分支提供互补的频率表示,融合后在预测性能上优于单分支模型。
- 在 Google 数据集上,经过自定义预处理后,HT-UNet 和 TD-FusionUNet 在 IoU 和 F1 上有显著提升,验证了变换域学习对稀疏火掩模的优势。
- 双分支 TD-FusionUNet 在没有导致参数难以承受的情况下展示了可扩展的性能提升。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。