Skip to main content
QUICK REVIEW

[論文レビュー] Rule-Based Spatial Mixture-of-Experts U-Net for Explainable Edge Detection

Bharadwaj Dogga, Kaaustaaub Shankar|arXiv (Cornell University)|Feb 4, 2026
Explainable Artificial Intelligence (XAI)被引用数 0
ひとこと要約

論文は sMoE U-Net を提案する。Spatially-Adaptive MoE ブロックと Takagi-Sugeno-Kang フ fuzzy ヘッドを用いたハイブリッドな説明可能なエッジ検出器で、ピクセルレベルの解釈性を維持しつつ競争力のある精度を達成する。

ABSTRACT

Deep learning models like U-Net and its variants, have established state-of-the-art performance in edge detection tasks and are used by Generative AI services world-wide for their image generation models. However, their decision-making processes remain opaque, operating as "black boxes" that obscure the rationale behind specific boundary predictions. This lack of transparency is a critical barrier in safety-critical applications where verification is mandatory. To bridge the gap between high-performance deep learning and interpretable logic, we propose the Rule-Based Spatial Mixture-of-Experts U-Net (sMoE U-Net). Our architecture introduces two key innovations: (1) Spatially-Adaptive Mixture-of-Experts (sMoE) blocks integrated into the decoder skip connections, which dynamically gate between "Context" (smooth) and "Boundary" (sharp) experts based on local feature statistics; and (2) a Takagi-Sugeno-Kang (TSK) Fuzzy Head that replaces the standard classification layer. This fuzzy head fuses deep semantic features with heuristic edge signals using explicit IF-THEN rules. We evaluate our method on the BSDS500 benchmark, achieving an Optimal Dataset Scale (ODS) F-score of 0.7628, effectively matching purely deep baselines like HED (0.7688) while outperforming the standard U-Net (0.7437). Crucially, our model provides pixel-level explainability through "Rule Firing Maps" and "Strategy Maps," allowing users to visualize whether an edge was detected due to strong gradients, high semantic confidence, or specific logical rule combinations.

研究の動機と目的

  • エクスプレインブルなファジー論理を高性能CNNバックボーンと統合して、エッジ検出の精度と解釈性を橋渡しする。
  • コンテキスト処理と境界処理の間で空間適応ゲーティングを行い、テクスチャノイズを抑えつつエッジのシャープさを保持する。
  • ルール発火マップとストラテジーマップを通じてピクセルレベルの説明を提供し、意思決定の根拠を可視化する。

提案手法

  • U-Net デコーダのスキップ接続に Spatially-Adaptive Mixture-of-Experts (sMoE) ブロックを組み込み、Sobell エッジマップによって推進されるゲーティングネットワークを用いて Smooth (context) と Sharp (boundary) の専門家をゲートする。
  • 標準の分類器を First-Order Takagi-Sugeno-Kang (TSK) フ fuzzy ヘッドに置換し、Edge Strength と Semantic Confidence を 4 個の学習可能なファジー規則で融合する。
  • 微分可能な Gaussian ベースのルール発火機構を用いて、最終的なエッジマップを規則結論の重み付き平均として計算する。
  • Binary Cross Entropy と Dice loss を組み合わせた複合損失で訓練し、ファジー ヘッドを MSE によって主な logits の模倣へ蒸留する。
  • Explainability visuals を提供:Strategy Maps と Rule Firing Maps を用いて、ピクセルごとに意思決定の過程を可視化する。
Figure 1 : Compact architecture of the proposed explainable sMoE U-Net with Sobel pre-processing and a TSK fuzzy head.
Figure 1 : Compact architecture of the proposed explainable sMoE U-Net with Sobel pre-processing and a TSK fuzzy head.

実験結果

リサーチクエスチョン

  • RQ1ハイブリッドな sMoE-U-Net は、説明可能性を実現しつつ最先端のエッジ検出性能を維持または超え得るか?
  • RQ2空間適応ゲーティングとファジー頭はエッジの境界づけと偽陽性の低減にどう寄与するか?
  • RQ3Strategy Maps や Rule Firing Maps はモデルのエッジに関する意思決定ロジックをどのように可視化するか?

主な発見

MethodOISODSAP
U-Net0.72600.74370.6946
sMoE U-Net (Ours)0.74580.76280.7222
Canny0.48360.54500.4125
Sobel0.53030.57690.4743
HED0.75140.76880.7126
  • sMoE U-Net は BSDS500 で ODS F-score 0.7628 を達成し、HED(0.7688)にほぼ匹敵し、標準の U-Net(0.7437)を上回る。
  • モデルはまた OIS 0.7458 と AP 0.7222 を達成し、AP で U-Net および HED を上回る。
  • sMoE ゲーティングは固定リコールでの精度を高めることを、精度-再現率曲線で示す。
  • 定性的分析は Strategy Maps が境界エキスパートの活性化をエッジで、Context エキスパートの活性化を均質な領域で強調することを示す。
  • Rule Firing Maps は強い edge / 柔らかい edge / ノイズの多い edge を左右する明確な IF-THEN 規則を明らかにし、解釈性を実現する。
Figure 2 : Architecture of Spatially-Adaptive Mixture-of-Experts with Sobel Edge signal
Figure 2 : Architecture of Spatially-Adaptive Mixture-of-Experts with Sobel Edge signal

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。