Skip to main content
QUICK REVIEW

[論文レビュー] BSRBF-KAN: A combination of B-splines and Radial Basis Functions in Kolmogorov-Arnold Networks

Hoang-Thang Ta|arXiv (Cornell University)|Jun 17, 2024
Advanced Numerical Analysis Techniques被引用数 7
ひとこと要約

BSRBF-KANはB-splinesとGaussian RBFをKolmogorov-Arnold Network内で組み合わせ、MNISTとFashion-MNISTで訓練し、いくつかのKANとMLPより競争力のある精度とより速い収束を達成します。

ABSTRACT

In this paper, we introduce BSRBF-KAN, a Kolmogorov Arnold Network (KAN) that combines B-splines and radial basis functions (RBFs) to fit input vectors during data training. We perform experiments with BSRBF-KAN, multi-layer perception (MLP), and other popular KANs, including EfficientKAN, FastKAN, FasterKAN, and GottliebKAN over the MNIST and Fashion-MNIST datasets. BSRBF-KAN shows stability in 5 training runs with a competitive average accuracy of 97.55% on MNIST and 89.33% on Fashion-MNIST and obtains convergence better than other networks. We expect BSRBF-KAN to open many combinations of mathematical functions to design KANs. Our repo is publicly available at: https://github.com/hoangthangta/BSRBF_KAN.

研究の動機と目的

  • 滑らかで制御可能な基底関数を得るために、B-splinesとRBFを融合して新しいKAN(BSRBF-KAN)を動機づけ、設計する。
  • MNISTおよびFashion-MNIST上で、他のKANやMLPと比較したBSRBF-KANの安定性と収束性を評価する。
  • 重要な構成要素を特定するため、B-splinesとRBFsの組み合わせの影響をアブレーション研究を通じて評価する。
  • 複合的な数学関数を用いた将来のKAN設計に向けた実証的指針を提供する。

提案手法

  • 多変量関数分解のためにKolmogorov-Arnold表現定理をKANの基盤とする。
  • 活性化関数がベース出力、B-splines、ガウスRBF成分の重み付き混合である順伝搬/逆伝搬アーキテクチャを実装する。
  • レイヤー正規化と標準の訓練設定(AdamW、CrossEntropy)を、GottliebKANを除く784-64-10のような比較可能なネットワーク形状で用いる。
  • B-splines、RBF、ベース出力、レイヤー正規化を除去するアブレーション研究を実施し、性能影響を評価する。

実験結果

リサーチクエスチョン

  • RQ1KAN内でB-splineとGaussian RBFの結合活性化は、MNISTおよびFashion-MNISTで既存のKAN/MLPの性能に匹敵するか、それを上回ることができるか?
  • RQ2B-splines、RBF、ベース出力、またはレイヤー正規化を除去するアブレーションは、BSRBF-KANの訓練の安定性と一般化にどう影響するか?
  • RQ3BSRBF-KANはEfficientKAN、FastKAN、FasterKAN、GottliebKAN、およびMLPと比べて、複数回の訓練実行でより速い収束と安定性を提供するか?
  • RQ4MNISTとFashion-MNISTの結果をBSRBF-KANで平均した場合、他の手法と比較して全体の性能はどうなるか? 탑

主な発見

データセットモデル訓練精度検証精度F1時間(秒)パラメータ数
MNISTBSRBF-KAN100.097.6397.6222459040
MNISTFastKAN99.9497.3897.34102459114
MNISTFasterKAN98.5297.3897.3693408224
MNISTEfficientKAN99.3497.5497.5122508160
MNISTGottliebKAN99.6697.7897.74269219927
MNISTMLP99.4297.6997.6627352512
Fashion-MNISTBSRBF-KAN99.389.5989.54219459040
Fashion-MNISTFastKAN98.2789.6289.60160459114
Fashion-MNISTFasterKAN94.489.3989.3157408224
Fashion-MNISTEfficientKAN94.8389.1189.04182508160
Fashion-MNISTGottliebKAN93.7987.6987.61241219927
Fashion-MNISTMLP93.5888.5188.4414752512
Average of MNIST + Fashion-MNISTBSRBF-KAN99.6593.6193.57220.5459040
Average of MNIST + Fashion-MNISTFastKAN99.1193.5093.47131459114
Average of MNIST + Fashion-MNISTFasterKAN96.4693.3993.33125408224
Average of MNIST + Fashion-MNISTEfficientKAN97.0993.3393.27152508160
Average of MNIST + Fashion-MNISTGottliebKAN96.7392.7492.68255219927
Average of MNIST + Fashion-MNISTMLP96.5093.1093.0521052512
  • BSRBF-KANは競争力のある精度を達成し、MNISTとFashion-MNISTの両方で速い収束を示す。
  • MNISTでは、BSRBF-KANが最良の実行で訓練精度100%、検証97.63%、F1 97.6に達する。
  • 平均化されたMNIST+Fashion-MNISTでは、BSRBF-KANが最も良い全体平均検証93.61%、F1 93.57%を提供する。
  • アブレーション研究は、ベース出力とレイヤー正規化が性能の決定的要因であることを示し、両方を除去すると、Fashion-MNISTではMLPに近い性能まで低下するか、それ以下になる。
  • GottliebKANはMNISTの検証精度を高めることがあるが、Fashion-MNISTでは不安定である; MLPはFashion-MNISTでKAN系より遅れることが多いが、訓練が最も速い場合がある。
  • BSRBF-KANは単一の784-64-10アーキテクチャを用い、報告された実行で平均約220秒と競争力のある訓練時間を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。