级联的人物 - 物品相互作用识别 | BriefGPT

CVPRMar, 2020

级联的人物 - 物品相互作用识别

Cascaded Human-Object Interaction Recognition

Tianfei Zhou, Wenguan Wang, Siyuan Qi, Haibin Ling, Jianbing Shen

TL;DR本文提出了一种基于级联架构的人体 - 目标交互理解方法，包括实例定位和交互识别两个阶段，并引入了关系排名和三元流分类器等组件，在边缘像素级别完成交互关系细分，实现了极佳的关系建模表现。

Abstract

Rapid progress has been witnessed for human-object interaction (HOI) recognition, but most existing models are confined to single-stage reasoning pipelines. Considering the intrinsic complexity of the task, we introduce a cascade architecture for a multi-stage, coarse-to-fine HOI under

human-object interaction multi-stage architecture interaction recognition relation detection pixel-wise segmentation

发现论文，激发创造

挖掘两阶段和单阶段 HOI 检测的优势

本文旨在探讨基于两阶段和单阶段方式的人 - 物交互检测方法各自的优点和缺点，并提出一种新的单阶段框架，该框架采用分离式的方法进行检测和分类，取得了明显的相对提升。

Aug, 2021

将 HOI 检测重构为自适应集合预测

本文提出一种基于 Adaptive Set Prediction 的 AS-Net 框架，通过多头注意力聚合查询集和全局上下文推理交互相关特征，同时使用实例感知注意模块将实例分支的特征引入交互分支，以实现更为准确高效的人物 - 物体交互检测。本方法在三个 HOI 检测数据集上实现比前沿方法更好的结果，尤其在大规模 HICO-DET 数据集上，相对于之前的最优结果实现了超过 31% 的性能提升。

Mar, 2021

使用交互点学习人 - 物交互检测

本文提出了一种基于全卷积的去检测人 - 物交互的新方法，该方法利用相互作用点直接定位和分类相互作用，并结合密集的相互作用向量，将相互作用与人和物的检测相结合，以获得最终的预测结果。该方法在 V-COCO 和 HICO-DET 两个常用基准上均取得了最新的最佳表现。

Mar, 2020

人物 - 物体交互识别中被忽视的分类器

本文探讨了人 - 物体交互检测的两个挑战：类别不平衡和每图像多标签需求的有效解决方法，分别是通过对比分析 HOIs 语言嵌入来初始化权重和使用 LSE-Sign 损失加强多标签学习，从而实现了无需依赖物体检测和人体姿势检测的 HOI 分类，在集成现有物体检测模型后，达到了最先进的检测结果。

Dec, 2021

面向人 - 物交互检测的姿态感知多层特征网络

本文介绍了一种利用人体姿态提示的多层次关系检测策略，通过深度学习的方法将人体姿态融入到三个语义层面的关系表示中，以解决人体场景中精细化的物体交互识别问题。实验证明本方法在公共基准测试中表现优异。

Sep, 2019

HOI Transformer 实现端到端人体对象交互检测

HOI Transformer 是一种用于解决人与物体交互检测任务的算法，它可以通过全局图像上下文来推断物体与人的关系并在并行统一的方式下直接预测 HOI 实例，并引入了五元匹配损失来统一强制 HOI 预测，并能够在 HICO-DET 和 V-COCO 上取得比以前更好的性能表现。

Mar, 2021

人 - 物交互检测的视觉 - 语义图注意力网络

通过双图注意力网络，可以动态地从主要的人 - 物关系和附属关系中聚合环境视觉、空间和语义信息以实现强大的消岐能力。

Jan, 2020

基于基础模型的空间提示学习的通用人物 - 物体交互关系检测器

在开放世界环境下，通过使用视觉语言（VL）基础模型和大型语言模型（LLMs），本研究探索了通用交互识别的方法，并通过进行深度分析和高级关系提取等设计，以实现超越现有方法的开放类别交互识别。

Nov, 2023

DRG: 用于人物 - 物体交互检测的双重关系图

本研究解决了人 - 物互动检测的难题，提出了一种利用抽象空间 - 语义表示来描述每个人 - 物对并通过双重关系图聚合场景的上下文信息的方法，该模型相对于现有的算法在两个大型基准数据集上表现出更加优良的结果。

Aug, 2020

iCAN: 实例中心注意力网络用于人 - 物交互检测

本文提出了一种利用实例注意力重点聚合一张图像中与人 - 物交互相关的特征，实现人 - 物交互检测任务的方法，并在 COCO 和 HICO-DET 数据集上验证了其有效性，结果明显优于现有技术。

Aug, 2018