Skip to main content
QUICK REVIEW

[論文レビュー] MatchED: Crisp Edge Detection Using End-to-End, Matching-based Supervision

Bedrettin Çetinkaya, Sinan Kalkan|arXiv (Cornell University)|Feb 24, 2026
Advanced Neural Network Applications被引用数 0
ひとこと要約

MatchED は、前処理を要しないエンドツーエンドのクリスプな1ピクセル級エッジを生む、軽量で学習可能なマッチングベースの監視モジュールを追加し、複数データセットで基底エッジ検出器を改善する。

ABSTRACT

Generating crisp, i.e., one-pixel-wide, edge maps remains one of the fundamental challenges in edge detection, affecting both traditional and learning-based methods. To obtain crisp edges, most existing approaches rely on two hand-crafted post-processing algorithms, Non-Maximum Suppression (NMS) and skeleton-based thinning, which are non-differentiable and hinder end-to-end optimization. Moreover, all existing crisp edge detection methods still depend on such post-processing to achieve satisfactory results. To address this limitation, we propose \MethodLPP, a lightweight, only $\sim$21K additional parameters, and plug-and-play matching-based supervision module that can be appended to any edge detection model for joint end-to-end learning of crisp edges. At each training iteration, \MethodLPP performs one-to-one matching between predicted and ground-truth edges based on spatial distance and confidence, ensuring consistency between training and testing protocols. Extensive experiments on four popular datasets demonstrate that integrating \MethodLPP substantially improves the performance of existing edge detection models. In particular, \MethodLPP increases the Average Crispness (AC) metric by up to 2--4$ imes$ compared to baseline models. Under the crispness-emphasized evaluation (CEval), \MethodLPP further boosts baseline performance by up to 20--35\% in ODS and achieves similar gains in OIS and AP, achieving SOTA performance that matches or surpasses standard post-processing for the first time. Code is available at https://cvpr26-matched.github.io.

研究の動機と目的

  • クリスプなエッジマップの必要性を動機づけ、非微分可能な後処理(NMSおよび thinning)への依存を制限する。
  • 微分可能でエンドツーエンドの訓練モジュールを提案し、1ピクセル幅のエッジを得る。
  • MatchED を多様なエッジ検出器と統合し、複数データセットでの評価を通じて汎用性を示す。

提案手法

  • 任意のエッジ検出器に対して軽量なCNNベースのモジュールを追加し、E^r からクリスプなエッジマップ E^c を生成する(約21Kパラメータ)。
  • 予測エッジ E^c とグラウンドトゥルース G との間で信頼度加重・距離ベースのコスト C(式3)を用いて1対1のマッチングを形成する。
  • 線形和割当を用いて最適な1対1割当 σ* を計算し、E^c を G に合わせる(式4)。
  • 最適割当を用いて精緻化したグラウンドトゥルース ˜G を得し、マッチしなかった GT ピクセルを割り当てる(式5, 式6)。
  • E^c と ˜G の二値交差エントロピーで訓練し(式7)、基底検出器の損失と共同最適化する(式8)。
  • データセット間でのロバスト性を示し、ハイパーパラメータ、効率、メモリ使用量を分析する。
Figure 1 : (a) Existing edge detectors require the use of a hand-crafted post-processing stage (e.g., NMS and thinning). (b) With MatchED , we generate a one-pixel-wide edge map in an end-to-end trainable manner. The recent DiffusionEdge’s results [ 44 ] (c) improve when integrated with MatchED (d)
Figure 1 : (a) Existing edge detectors require the use of a hand-crafted post-processing stage (e.g., NMS and thinning). (b) With MatchED , we generate a one-pixel-wide edge map in an end-to-end trainable manner. The recent DiffusionEdge’s results [ 44 ] (c) improve when integrated with MatchED (d)

実験結果

リサーチクエスチョン

  • RQ1エンドツーエンドで微分可能なマッチングベースの監視によって、後処理なしでよりクリスプなエッジマップを得られるか?
  • RQ2MatchED は多様なエッジ検出器とデータセットに汎用性を持ち、CEval 下で AC, ODS, OIS, AP を改善するか?
  • RQ3マッチングベースの監視のハイパーパラメータが性能と効率に与える影響は?

主な発見

  • MatchED は複数データセットでベースラインより最大2–4倍の平均クリスプネス(AC)を改善。
  • CEval において、MatchED の組み込みはODS、OIS、APを最大20–35%向上させ、しばしば後処理の性能と同等またはそれを超える。
  • MatchED は BSDS、NYUD-v2、BIPED-v2 データセットでベースモデル(PiDiNet、RankED、SAUGE)を大幅に改善。
  • モジュールは約21Kパラメータを追加し、CPUタイミング実験では標準のNMS+細線化より高速に動作。
  • MatchED は最先端のクリスプエッジモデル DiffusionEdge のクリスプリネスを強化し、優れた汎化性を示す。
  • ゼロショットテストでは、一つのデータセットで学習し別のデータセットでテストする場合でも競争力のある性能を示す。
Figure 2 : An overview of MatchED , which can be easily integrated into any edge detector pipeline. A lightweight CNN consists of five blocks, each containing Conv2D, ReLU, and normalization layers, followed by a final Conv2D layer with a sigmoid activation. Therefore, MatchED adds only approximatel
Figure 2 : An overview of MatchED , which can be easily integrated into any edge detector pipeline. A lightweight CNN consists of five blocks, each containing Conv2D, ReLU, and normalization layers, followed by a final Conv2D layer with a sigmoid activation. Therefore, MatchED adds only approximatel

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。