[論文レビュー] Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise
本論文は、ラベルノイズ下での3D セマンティック占有予測の初のベンチマークOccNLと、ボクセルレベルのラベル破損に頑健に対処するデュアルソース部分ラベル推論フレームワークDPR-Occを導入し、SemanticKITTIで極端なノイズ時に強い利益を示す。
3D semantic occupancy prediction is a cornerstone of robotic perception, yet real-world voxel annotations are inherently corrupted by structural artifacts and dynamic trailing effects. This raises a critical but underexplored question: can autonomous systems safely rely on such unreliable occupancy supervision? To systematically investigate this issue, we establish OccNL, the first benchmark dedicated to 3D occupancy under occupancy-asymmetric and dynamic trailing noise. Our analysis reveals a fundamental domain gap: state-of-the-art 2D label noise learning strategies collapse catastrophically in sparse 3D voxel spaces, exposing a critical vulnerability in existing paradigms. To address this challenge, we propose DPR-Occ, a principled label noise-robust framework that constructs reliable supervision through dual-source partial label reasoning. By synergizing temporal model memory with representation-level structural affinity, DPR-Occ dynamically expands and prunes candidate label sets to preserve true semantics while suppressing noise propagation. Extensive experiments on SemanticKITTI demonstrate that DPR-Occ prevents geometric and semantic collapse under extreme corruption. Notably, even at 90% label noise, our method achieves significant performance gains (up to 2.57% mIoU and 13.91% IoU) over existing label noise learning baselines adapted to the 3D occupancy prediction task. By bridging label noise learning and 3D perception, OccNL and DPR-Occ provide a reliable foundation for safety-critical robotic perception in dynamic environments. The benchmark and source code will be made publicly available at https://github.com/mylwx/OccNL.
研究の動機と目的
- 3Dセマンティック占有予測におけるボクセルレベルのラベルノイズの研究動機づけと現在の手法への影響の定量化。
- 占有を占有性非対称および動的追従ノイズの下で制御可能な最初のベンチマークとしてOccNLを提案。
- デュアルソース部分ラベル推論を用いた頑健な学習フレームワーク(DPR-Occ)を開発し、ラベルノイズを低減。
- 実世界データセットで極端なノイズ下でも幾何と意味情報を保持することを示す。
提案手法
- OccNLを導入。占有性非対称ボクセルノイズと実世界の追従ノイズを含むベンチマーク。
- 3D占有へ適用する5つの画像ドメインのラベルノイズ耐性手法を適用し、失敗を示す。
- DPR-Occを提案。EMA教師とプロトタイプ親和性からのデュアルソース部分ラベルを使用。
- 動的-Kスケジューリング、部分ラベル学習、ネガティブ学習、EMAガイド付き自己蒸留を2段階の訓練で活用。
- ノイズ抑制のためPLL、NL、SNTDをEMA監視付きで組み合わせた頑健な損失構成を採用。
実験結果
リサーチクエスチョン
- RQ1ラベルノイズはボクセル空間での3Dセマンティック占有予測にどのような影響を与えるか?
- RQ22D画像ラベルノイズ戦略を崩壊せずに3D占有へ転用できるか?
- RQ3デュアルソース部分ラベルアプローチはボクセルレベルのノイズに対する頑健性を向上させるか?
- RQ4SemanticKITTIにおける極端なノイズ下でのグラウンドトゥルース保持と意味的精度の利得はどれくらいか?
- RQ5動的追従アーティファクトは3D占有タスクのモデル頑健性とどのように相互作用するか?
主な発見
- OccNLは二段階の劣化を明らかにする:低ノイズでは幾何は安定するが、閾値を超えると意味と希少動的カテゴリーの性能が崩れる。
- 最先端の画像ノイズ耐性手法はボクセルノイズ90%で崩壊し、特に稀な動的カテゴリーで顕著。
- DPR-Occは極端なノイズ下で幾何IoUと意味的IoUを維持し、ベースラインを最大でIoU+2.57%、IoU+13.91%の設定で上回る。
- DPR-Occのデュアルソース部分ラベル推論とEMAガイド付き蒸留は崩壊を防ぎ、動的物体識別性を保持する。
- Dynamic-KスケジューリングとPLL/NL/SNTD損失は、合成および実世界の追従ノイズの下でも安定した性能へ貢献する。
- SemanticKITTIでの実験は、複数のノイズレジームでベースラインを上回る顕著な改善を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。