QUICK REVIEW

[논문 리뷰] U-Net with Hadamard Transform and DCT Latent Spaces for Next-day Wildfire Spread Prediction

Yingyi Luo, Shuaiang Rong|arXiv (Cornell University)|2026. 02. 12.

Fire effects on ecosystems인용 수 0

한 줄 요약

이 논문은 Train Domain Fusion UNet(TD-FusionUNet)을 도입합니다. 경량 변환 도메인 UNet으로 trainable Hadamard 및 DCT 층을 사용해 다중 모달 위성 데이터를 바탕으로 다음 날 산불 확산을 예측하며, 파라미터 수가 훨씬 작으면서도 최첨단 정확도를 달성합니다.

ABSTRACT

We developed a lightweight and computationally efficient tool for next-day wildfire spread prediction using multimodal satellite data as input. The deep learning model, which we call Transform Domain Fusion UNet (TD-FusionUNet), incorporates trainable Hadamard Transform and Discrete Cosine Transform layers that apply two-dimensional transforms, enabling the network to capture essential "frequency" components in orthogonalized latent spaces. Additionally, we introduce custom preprocessing techniques, including random margin cropping and a Gaussian mixture model, to enrich the representation of the sparse pre-fire masks and enhance the model's generalization capability. The TD-FusionUNet is evaluated on two datasets which are the Next-Day Wildfire Spread dataset released by Google Research in 2023, and WildfireSpreadTS dataset. Our proposed TD-FusionUNet achieves an F1 score of 0.591 with 370k parameters, outperforming the UNet baseline using ResNet18 as the encoder reported in the WildfireSpreadTS dataset while using substantially fewer parameters. These results show that the proposed latent space fusion model balances accuracy and efficiency under a lightweight setting, making it suitable for real time wildfire prediction applications in resource limited environments.

연구 동기 및 목표

정확한 다음 날 산불 확산 예측을 통해 자원 배치와 긴급 대응을 최적화한다.
sparse 산불 마스크를 포착하는 주파수 도메인 특징을 포착하는 경량 변환 도메인 신경망을 개발한다.
전처리 보강으로 학습 데이터를 확장해 예열 전 마스크의 희박성 및 불균형 문제를 해결한다.
낮은 파라미터 수와 계산 효율성으로 엣지 친화적 모델 배포 가능성을 보여준다.

제안 방법

2D Hadamard 변환을 적용하고 학습 가능한 채널별 스케일링 및 소프트 임계치를 포함하는 HT-퍼셉트론 블록을 도입하고 역 Hadamard 재구성으로 이어간다.
fusion 계층을 통해 Hadamard 도메인 특징과 DCT 도메인 특징을 융합하는 듀얼 브랜치 아키텍처(TD-FusionUNet)를 확장한다.
평행 브랜치에 2D DCT-퍼셉트론 블록을 포함하고 디코딩 중 HT와 DCT 특징을 융합한다.
희박성 완화를 위해 임의 경계 자르기와 가우시안 혼합 스무딩의 두 가지 커스텀 전처리 기술을 적용해 일반화 성능을 향상시킨다.
Google Research Next-Day Wildfire Spread 및 WildfireSpreadTS 데이터셋에서 UNet 베이스라인 및 경량 변형과 비교 평가한다.

실험 결과

연구 질문

RQ1Hadamard 및 DCT 층을 포함한 변환 도메인 학습이 경량 모델을 유지하면서 다음 날 산불 확산 예측을 개선할 수 있는가?
RQ2듀얼-브랜치 변환 도메인 융합(Ht + DCT)이 단일-브랜치 변환 UNet 및 전통 UNet보다 희박한 데이터 조건에서 우수한가?
RQ3커스텀 전처리 기술이 희박한 전-fire 마스크에서 모델 일반화를 향상시키는가?
RQ4TD-FusionUNet가 엣지 배포에 적합하며 경쟁력 있는 정확도와 현저히 적은 파라미터 수를 보여주는가?

주요 결과

TD-FusionUNet(기본 채널 폭 8) 가 WildfireSpreadTS에서 F1 0.591로 가장 높은 값을 달성하며 370k 파라미터로 ResNet18 기반 UNet 베이스라인을 능가한다.
단일 브랜치 HT-UNet은 CNN 오토인코더 베이스라인 대비 매개변수를 50% 이상 줄이면서도 표준 및 커스텀 전처리에서 IoU 및 F1을 향상시킨다.
HT 기반 및 DCT 기반 변환 브랜치는 보완적인 주파수 표현을 제공하며 융합 시 단일 브랜치 모델보다 우수한 예측 성능을 낸다.
Google 데이터셋에서 HT-UNet 및 TD-FusionUNet은 커스텀 전처리로 IoU와 F1에서 상당한 이점을 보이며 희박한 화염 마스크에 대한 변환 도메인 학습의 이점을 확인한다.
듀얼-브랜치 TD-FusionUNet은 파라미터 증가에 비례한 제조적 한계를 넘지 않는 확장 가능한 성능 향상을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.