Skip to main content
QUICK REVIEW

[論文レビュー] Convolutional Networks for Spherical Signals

Taco Cohen, Mario Geiger|arXiv (Cornell University)|Sep 14, 2017
Neural Networks and Applications被引用数 56
ひとこと要約

この論文は、球面と SO(3) 上で回転重み共有を行う球面畳み込みネットワークを提案し、球データ上で回転等変性深層学習を可能にし、球面 MNIST で強力な回転不変分類を実証する。

ABSTRACT

The success of convolutional networks in learning problems involving planar signals such as images is due to their ability to exploit the translation symmetry of the data distribution through weight sharing. Many areas of science and egineering deal with signals with other symmetries, such as rotation invariant data on the sphere. Examples include climate and weather science, astrophysics, and chemistry. In this paper we present spherical convolutional networks. These networks use convolutions on the sphere and rotation group, which results in rotational weight sharing and rotation equivariance. Using a synthetic spherical MNIST dataset, we show that spherical convolutional networks are very effective at dealing with rotationally invariant classification problems.

研究の動機と目的

  • 球面データに対する群等変性畳み込みの利用を動機づけ、形式化する。
  • 球面畳み込みとSO(3)畳み込み、およびそれらのフーリエ理論的基盤を定義する。
  • 球面/CovSO(3)畳み込みのための効率的な一般化FFTベースの実装を開発する。
  • 球面MNISTデータセットを用いた実験を通じて回転不変性の利点を示す。

提案手法

  • 回転フィルタとの内積を用いて、S^2 上の f * ψ を SO(3) 上の関数として定義する(式( Eq. 1))。
  • SO(3) 上の f * ψ を SO(3) 全体での積分により定義する(式( Eq. 2))。
  • S^2 および SO(3) 上での一般化フーリエ変換(GFT) を、ウィグナーD関数と球面調和関数を用いて用いる(式( Eq. 3-4))。
  • GFT領域での畳み込み定理を適用し、球面/SO(3) の効率的な畳み込みを実現する。
  • 球面ConvNetを構築する: S^2 Conv → 非線形性 → SO(3) Conv → 非線形性 → 最終線形層とソフトマックス。
  • 層を通じた帯域幅削減とチャネル拡張を活用する;残差接続とバッチ正規化を可能にする。

実験結果

リサーチクエスチョン

  • RQ1球面および SO(3) 畳み込みは、ネットワークの層を通じて回転対応性を提供できるか。
  • RQ2一般化FFTをどのように用いて球と回転群上の畳み込みを効率的に実装できるか。
  • RQ3球面CNNは平面CNNと比較して回転不変分類性能が向上するか。
  • RQ4サンプリングと深さにおける等変性の数値的挙動はどうなるか。
  • RQ5提案アーキテクチャの回転頑健性を球面MNISTベンチマークはどのように示すか。

主な発見

ModelNR/NRR/RNR/R
planar0.990.450.09
spherical0.910.910.85
  • 球面および SO(3) 畳み込みは、回転に対して数学的に等変である。
  • 効率的なGFFTベースの実装は、S^2とSO(3)上の畳み込みをサポートする。
  • 球面MNISTにおける回転した球面データで、球面CNNは平面CNNを上回る。
  • NR/R の場合、球面CNNは非回転データで訓練し回転データで評価しても高い精度を維持する。
  • R/R の場合、球面CNNは0.91の精度、平面は0.45。
  • NR/R の場合、球面CNNは0.85、平面は0.09。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。