Skip to main content
QUICK REVIEW

[论文解读] Transferable Interactiveness Prior for Human-Object Interaction Detection.

Yong–Lu Li, Siyuan Zhou|arXiv (Cornell University)|Nov 20, 2018
Multimodal Machine Learning Applications参考文献 27被引用 37
一句话总结

本文提出一种可迁移的交互性先验,通过在不同数据集间学习可泛化的交互模式,以提升人-物体交互(HOI)检测性能。其采用交互性网络在推理阶段抑制非交互样本,显著提升了HICO-DET和V-COCO数据集上的性能,达到当前最先进水平。

ABSTRACT

Human-Object Interaction (HOI) Detection is an important problem to understand how humans interact with objects. In this paper, we explore extbf{Interactiveness Prior} which indicates whether human and object interact with each other or not. We found that interactiveness prior can be learned across HOI datasets, regardless of HOI category settings. Our core idea is to exploit an Interactiveness Network to learn the general interactiveness prior from multiple HOI datasets and perform Non-Interaction Suppression before HOI classification in inference. On account of the generalization of interactiveness prior, interactiveness network is a transferable knowledge learner and can be cooperated with any HOI detection models to achieve desirable results. We extensively evaluate the proposed method on HICO-DET and V-COCO datasets. Our framework outperforms state-of-the-art HOI detection results by a great margin, verifying its efficacy and flexibility. Source codes and models will be made publicly available.

研究动机与目标

  • 为解决在多样化且复杂的视觉场景中检测人-物体交互的挑战。
  • 学习一种通用的交互性先验,以捕捉人与物体是否交互,而独立于特定的HOI类别。
  • 实现该先验在不同HOI数据集和检测模型之间的可迁移性。
  • 通过在推理阶段抑制非交互的人-物体对,提升HOI检测性能。

提出的方法

  • 在多个HOI数据集上训练交互性网络,以学习交互可能性的通用表征。
  • 利用学习到的交互性先验,在最终HOI分类前抑制非交互的人-物体对。
  • 将交互性网络作为即插即用模块,集成到任意现有HOI检测模型中。
  • 利用多数据集监督,增强交互性先验的泛化能力。
  • 在推理阶段,利用预测的交互性分数执行非交互抑制。
  • 确保该方法对多种HOI检测架构具有灵活性和兼容性。

实验结果

研究问题

  • RQ1交互性先验是否能在不同HOI数据集之间有效学习并迁移?
  • RQ2学习通用交互性先验是否能提升在零样本或少样本设置下的HOI检测性能?
  • RQ3交互性先验是否可作为通用抑制机制,适用于多种HOI检测模型?
  • RQ4所提方法在基准HOI数据集上与当前最先进方法相比表现如何?

主要发现

  • 所提方法在HICO-DET和V-COCO两个数据集上均达到当前最先进性能。
  • 交互性先验在不同HOI数据集间具有良好泛化能力,即使在类别设置变化时亦然。
  • 交互性网络作为可迁移的知识学习器,显著提升了多种HOI检测模型的性能。
  • 利用学习到的先验进行非交互抑制,能通过过滤掉大量误检显著提升检测准确率。
  • 该方法在与现有HOI检测框架的兼容性与灵活性方面表现优异。
  • 源代码与训练模型将公开发布,以支持可复现性与进一步研究。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。