Skip to main content
QUICK REVIEW

[論文レビュー] A complete set of rotationally and translationally invariant features for images

Risi Kondor|arXiv (Cornell University)|Jan 20, 2007
Optical Polarization and Ellipsometry被引用数 9
ひとこと要約

本稿では、SO(3) 上の二重スペクトルの3次元一般化から導かれる3次多項式を用いて、回転および並進に対して不変な特徴量の完全な集合を導入する。特徴量は剛体変換を除き元の画像を一意に再構成可能であり、球面射影と回転群上の調和解析を活用する。

ABSTRACT

We propose a new set of rotationally and translationally invariant features for image or pattern recognition and classification. The new features are cubic polynomials in the pixel intensities and have the unusual property that up to numerical error and a bandwidth limit they are complete, in the sense that they uniquely determine the original image modulo rigid transformations. Our construction is based on the generalization of the concept of bispectrum to the three-dimensional rotation group SO(3), and a projection of the image onto the sphere.

研究の動機と目的

  • 回転および並進に対して不変な画像特徴量の完全な集合を開発すること。
  • 画像認識分野における完全で数値的に安定な不変特徴量集合の欠如に対処すること。
  • 1次元信号における二重スペクトル概念を3次元回転群 SO(3) に一般化し、画像データに適用すること。
  • 特徴量が剛体変換を除き元の画像を一意に特定できることを保証すること。

提案手法

  • 画像を球面に射影することで、3次元回転群 SO(3) 上での解析が可能になる。
  • SO(3) に二重スペクトル概念の一般化を適用し、不変特徴量を抽出する。
  • 特徴量は画素強度の3次多項式として構築され、剛体変換に対して不変性を保証する。
  • 画像の内容を回転および並進不変基底で表現するために、SO(3) 上の調和解析を用いる。
  • 帯域制限により数値的安定性を達成し、誤差範囲内で完全性を保持する。
  • 得られる特徴量集合は、剛体変換を除き元の画像を一意に特定する意味で完全である。

実験結果

リサーチクエスチョン

  • RQ1SO(3) 上の調和解析を用いて、2次元画像に対して完全な回転および並進不変特徴量集合を構築可能か?
  • RQ2画像表現のために、二重スペクトル概念を3次元回転群にどのように一般化できるか?
  • RQ3これらの特徴量は、剛体変換下でも画像の内容をどの程度保っているか?
  • RQ4帯域制限が数値的安定性および完全性を保証する役割を果たす程度は?
  • RQ5特徴量集合は、剛体変換を除き元の画像を一意に再構成可能か?

主な発見

  • 提案された特徴量は、構築上、回転および並進に対して不変である。
  • 特徴量集合は完全であり、剛体変換を除き元の画像を一意に特定可能である。
  • 数値誤差および帯域制限の制約内で完全性を達成している。
  • 特徴量は画素強度の3次多項式であるため、計算が効率的に行える。
  • 画像の球面射影により、SO(3) 上の調和解析の適用が可能になる。
  • SO(3) への二重スペクトルの一般化が、不変性および完全性の理論的基盤を形成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。