Skip to main content
QUICK REVIEW

[论文解读] On the closed-form solution of the rotation matrix arising in computer vision problems

Andriy Myronenko, Xubo Song|ArXiv.org|Apr 9, 2009
Robotics and Sensor-Based Localization参考文献 10被引用 50
一句话总结

本文为最大化 tr(AᵀR) 的最优旋转矩阵 R 提供了全面的闭式解,这是计算机视觉中的核心问题。通过矩阵 A 的 SVD 分解,解为 R = UCVᵀ,其中 C 调整以满足行列式约束,其唯一性取决于 A 的秩和奇异值结构,包括此前被忽略的退化情形。

ABSTRACT

We show the closed-form solution to the maximization of trace(A'R), where A is given and R is unknown rotation matrix. This problem occurs in many computer vision tasks involving optimal rotation matrix estimation. The solution has been continuously reinvented in different fields as part of specific problems. We summarize the historical evolution of the problem and present the general proof of the solution. We contribute to the proof by considering the degenerate cases of A and discuss the uniqueness of R.

研究动机与目标

  • 提供最大化 tr(AᵀR) 于旋转矩阵 R 上的统一、通用闭式解的完整证明。
  • 通过解决矩阵 A 的退化情形(特别是当 rank(A) < D−1 或最小奇异值不唯一时),弥合先前推导中的不一致与遗漏。
  • 阐明最优旋转矩阵 R 在何种条件下唯一或非唯一,尤其在数值敏感情形下。
  • 统一并追溯该优化问题在计算机视觉、Procrustes 分析与正交逼近中历史演变的脉络。
  • 提供一种适用于任意维度的鲁棒、数值稳定的 R 计算方法,同时关注舍入误差下的敏感性。

提出的方法

  • 将带约束的优化问题表述为在 RᵀR = I 且 det(R) = 1 的条件下最大化 tr(AᵀR)。
  • 应用拉格朗日乘子法,推导出最优性条件 RᵀA = RᵀAᵀR,从而导出涉及 A 的 SVD 的特征值类似结构。
  • 对 A 进行 SVD 分解,表示为 A = UΣVᵀ,其中 U 和 V 为正交矩阵,Σ 为包含非负奇异值的对角矩阵。
  • 构造最优旋转矩阵为 R = UCVᵀ,其中 C 为对角矩阵,除最后一个对角元素外其余均为 1,最后一个元素设为 det(UVᵀ) 以满足正规旋转(det(R) = 1)。
  • 分析退化情形:当 rank(A) < D−1 或最小奇异值不唯一且 det(A) < 0 时,显示 R 的非唯一性。
  • 证明在退化条件下,R 对 A 的微小扰动(包括舍入误差)表现出高度敏感性,尤其当奇异值接近或重复时。

实验结果

研究问题

  • RQ1在约束 RᵀR = I 且 det(R) = 1 下,最优旋转矩阵 R 的一般闭式解是什么?
  • RQ2最优旋转矩阵 R 在何种条件下唯一,何种情形下出现非唯一?
  • RQ3低秩 A 或最小奇异值不唯一等退化情形如何影响解的唯一性与稳定性?
  • RQ4为何先前的推导(包括 Umeyama 的方法)在处理这些退化情形时存在不完整?
  • RQ5数值舍入误差如何影响退化或病态情形下计算得到的旋转矩阵?

主要发现

  • 最优旋转矩阵为 R = UCVᵀ,其中 C = diag(1, ..., 1, det(UVᵀ)),由 A 的 SVD 推导得出。
  • 当 rank(A) < D−1 或 det(A) < 0 且最小奇异值不唯一时,解不唯一,此时存在多个有效的 R 矩阵。
  • 在退化情形下,解仍为全局最优,但对 A 的微小扰动(包括数值舍入误差)表现出高度敏感性。
  • 当 A 奇异且 rank(A) = D−1 时,仅当最后一个奇异值为零且通过 C 满足行列式约束时,解 R 才唯一。
  • 对于非奇异 A 且奇异值互异的情形,即使 V 不唯一,R 仍被唯一确定,原因在于 Σ⁻¹ 的结构及 VΣ⁻¹Vᵀ 的不变性。
  • 该方法可推广至任意维度,提供一种数值稳定、闭式可解的解法,适用于计算机视觉中的各类任务,如绝对定向、Procrustes 分析与正交逼近。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。