Skip to main content
QUICK REVIEW

[논문 리뷰] KAN-FIF: Spline-Parameterized Lightweight Physics-based Tropical Cyclone Estimation on Meteorological Satellite

Jiakang Shen, Qinghui Chen|arXiv (Cornell University)|2026. 02. 12.
Tropical and Extratropical Cyclones Research인용 수 0
한 줄 요약

KAN-FIF는 Kolmogorov–Arnol’d 네트워크를 사용하여 엣지 디바이스에서 열대 사이클론의 MSW와 RMW를 추정하는 경량의 물리 기반 멀티모달 프레임워크를 제시하고, 매개변수와 레이턴시를 크게 줄이면서 정확도를 유지한다.

ABSTRACT

Tropical cyclones (TC) are among the most destructive natural disasters, causing catastrophic damage to coastal regions through extreme winds, heavy rainfall, and storm surges. Timely monitoring of tropical cyclones is crucial for reducing loss of life and property, yet it is hindered by the computational inefficiency and high parameter counts of existing methods on resource-constrained edge devices. Current physics-guided models suffer from linear feature interactions that fail to capture high-order polynomial relationships between TC attributes, leading to inflated model sizes and hardware incompatibility. To overcome these challenges, this study introduces the Kolmogorov-Arnold Network-based Feature Interaction Framework (KAN-FIF), a lightweight multimodal architecture that integrates MLP and CNN layers with spline-parameterized KAN layers. For Maximum Sustained Wind (MSW) prediction, experiments demonstrate that the KAN-FIF framework achieves a $94.8\%$ reduction in parameters (0.99MB vs 19MB) and $68.7\%$ faster inference per sample (2.3ms vs 7.35ms) compared to baseline model Phy-CoCo, while maintaining superior accuracy with $32.5\%$ lower MAE. The offline deployment experiment of the FY-4 series meteorological satellite processor on the Qingyun-1000 development board achieved a 14.41ms per-sample inference latency with the KAN-FIF framework, demonstrating promising feasibility for operational TC monitoring and extending deployability to edge-device AI applications. The code is released at https://github.com/Jinglin-Zhang/KAN-FIF.

연구 동기 및 목표

  • 자원 제약이 있는 엣지 디바이스에서 시의적절한 열대 사이클론 모니터링을 촉진한다.
  • 정확도를 유지하거나 향상시키면서 모델 크기와 추론 지연을 줄인다.
  • 적외선 영상과 시간적 TC 특징 간의 크로스 모달 상호 의존성을 물리 기반 제약으로 모델링한다.
  • FY-4 위성 프로세서 하드웨어에서 엣지 배치 가능성을 입증한다.

제안 방법

  • 전통적인 CNN/MLP 구성요소를 Kolmogorov–Arnold Network (KAN) 계층으로 대체하여 매개변수를 대폭 감소시킨다.
  • 물리 기반의 미분가능한 다항 제약을 갖춘 하이브리드 인코더를 통해 시간 순서 데이터와 적외선 이미지를 융합한다.
  • MSW와 RMW 간의 고차 다항 관계를 모형화하기 위해 물리 기반 제약 모듈을 포함한다.
  • 시간적 특징과 공간적 특징에 대해 각각 KAN- 기반 공유 특징 추출(KAN-LSTM 및 KAN-CNN)을 사용한다.
  • 중심 인식 주의(attention)를 갖춘 공간 거리 및 내용 특징을 인코딩하기 위한 KAN 기반 주의 메커니즘을 구현한다.
  • LSTM을 제거하고 엣지 하드웨어 호환성을 위한 고정 계산 그래프를 적용하여 배치 가능한 버전을 배포한다.

실험 결과

연구 질문

  • RQ1KAN 계층이 훨씬 적은 매개변수로도 유사하거나 더 나은 TC 속성 예측 정확도를 달성할 수 있는가?
  • RQ2물리 기반의 고차 다항 제약이 MSW와 RMW 예측의 연계를 얼마나 효과적으로 만드는가?
  • RQ3FY-4 위성 하드웨어에서 실시간 또는 준실시간 지연으로 엣지 디바이스 배치가 가능합니까?
  • RQ4순차 특징과 적외선 영상의 멀티모달 융합이 단일 모달 모델보다 MSW/RMW 추정에 개선을 가져오는가?

주요 결과

모델MSW MAEMSW RMSERMW MAERMW RMSE
TC-MTLNet9.9913.7711.0314.53
DeepCNet6.849.2511.2115.10
DeepMicroNet3.945.47Single-task-
TCIEnet3.614.93--
TCICEnet3.474.75--
Xception3.884.50--
Phy-CoCo4.766.338.8912.24
KAN-FIF3.214.318.8311.66
  • KAN-FIF는 Phy-CoCo에 비해 94.8% 매개변수 감소(0.99 MB 대 19 MB)와 샘플당 추론을 68.7% 빠르게 수행한다(2.3 ms 대 7.35 ms).
  • MSW MAE를 Phy-CoCo 대비 32.5% 감소(3.21 kt 대 4.76 kt), MSW RMSE를 31.9% 감소(4.31 kt 대 6.33 kt).
  • RMW MAE가 약간 개선되어 8.83 nmi 대 8.89 nmi이며 MSW/RMW RMSE도 개선되어 RMW는 11.66 대 12.24 RMSE.
  • Qingyun-1000 보드를 사용하는 FY-4 프로세서에서의 오프라인 배포가 샘플당 추론 잠복 14.41 ms를 달성하여 엣지 가능성을 보여준다.
  • 배치 배치를 위한 LSTM 제거로 정확도 손실이 미미했고, 정적 그래프 엣지 배포 경로가 가능함을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.