Skip to main content
QUICK REVIEW

[论文解读] MetaAnchor: Learning to Detect Objects with Customized Anchors

Tong Yang, Xiangyu Zhang|arXiv (Cornell University)|Jul 3, 2018
Advanced Neural Network Applications被引用 89
一句话总结

MetaAnchor 引入一个动态锚点函数生成器,将自定义先验框映射到锚点函数,从而提高对锚点设置和边界框分布的鲁棒性,并在 COCO 检测性能上超越 RetinaNet 基线。

ABSTRACT

We propose a novel and flexible anchor mechanism named MetaAnchor for object detection frameworks. Unlike many previous detectors model anchors via a predefined manner, in MetaAnchor anchor functions could be dynamically generated from the arbitrary customized prior boxes. Taking advantage of weight prediction, MetaAnchor is able to work with most of the anchor-based object detection systems such as RetinaNet. Compared with the predefined anchor scheme, we empirically find that MetaAnchor is more robust to anchor settings and bounding box distributions; in addition, it also shows the potential on transfer tasks. Our experiment on COCO detection task shows that MetaAnchor consistently outperforms the counterparts in various scenarios.

研究动机与目标

  • 激励灵活、鲁棒的锚点,使其不固定于预定义的一组先验。
  • 提出一种机制,可从任意先验框动态生成锚点函数。
  • 展示基于权重预测的锚点函数生成提升检测鲁棒性和迁移能力。
  • 证明在如 RetinaNet 的单阶段检测器上,在 COCO 数据集上的兼容性和收益。

提出的方法

  • 引入一个锚点函数生成器 G(bi; w),它将先验框 bi 映射到锚点函数 Fi_bi。
  • 将 Fi_bi 建模为 Fi_bi(x; θi) = Fi(x; θbi),其中 θbi = θ* + R(bi; w),其中 R 是一个小型神经网络。
  • 为 G(·) 提供数据无关和数据相关两种变体,以预测 Fi 的参数。
  • 使用相对于一个标准锚框 (AH, AW) 的对数尺度高宽比来表示先验 bi。
  • 通过用用于分类和回归头的生成器替换固定的锚点头,将 MetaAnchor 应用于 RetinaNet,在不同层之间共享 G(·),并使用层特定的标准框。
  • 可选地通过对 bi 进行随机扰动来增强训练,从而提高鲁棒性。

实验结果

研究问题

  • RQ1是否可以从任意先验框动态生成锚点函数,而不是枚举先验?
  • RQ2MetaAnchor 是否提高对锚箱分布的鲁棒性以及跨数据集的迁移能力?
  • RQ3锚点函数生成器的数据无关与数据相关变体在性能上如何比较?
  • RQ4在推理时灵活的锚点配置对检测性能有何影响?
  • RQ5MetaAnchor 是否能够有效集成到现有的单阶段检测器(如 RetinaNet),以提升在 COCO 上的检测指标?

主要发现

  • MetaAnchor 在多种锚点配置下持续优于 RetinaNet 基线,例如 mmAP 提升约 0.2–0.8%,AP50 提升约 0.8–1.5%。
  • 在训练/推理中使用更多锚点通常会提升 MetaAnchor 的性能,但在 7×7 或 9×9 配置后收益趋于递减。
  • 在 COCO-full 上,MetaAnchor 在 minival 上达到 37.5% mmAP,比最佳 RetinaNet 实现高出 1.7%,比最佳带搜索配置的 RetinaNet 高出 0.6%;数据相关变体额外提升约 0.4%。
  • 在从 COCO-full 转移到 VOC2007 时,MetaAnchor 显示出比 RetinaNet 更强的迁移能力,在分布变化下性能退化显著降低。
  • 贪心搜索推理策略在测试时通过选择带来分数提升的锚点配置进一步提升 MetaAnchor 的性能。
  • 在若干设置中,数据相关的锚点函数生成器通常表现略优于数据无关的变体。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。