基于神经网络序列标注的威胁指标自动识别
我们提出了一种基于可靠性的训练数据清洗方法,利用归纳性依从预测 (ICP) 计算的可靠性度量来纠正大量嘈杂的训练数据中的标签错误和异常值,验证了该方法在三个分类任务中的有效性,显示出显著的分类性能提升,无需过多精心策划的训练数据。
Sep, 2023
人物 - 物体互动(HOI)检测是理解人类活动和视觉场景的重要组成部分。本研究通过引入 transformer-based 框架,重新组合不同 HOI 实例中的人物 - 物体对表示和互动表示,从而获得更丰富的上下文信息,提高知识的泛化能力,并实现一种简单而有效的方法,其在稀有 HOI 类别上表现出卓越的性能。
Aug, 2023
本论文提出了一种深度可视化组合学习 (VCL) 框架,通过分解和组合 HOI 表示来解决 HOI 检测中的长尾分布问题,共享不同 HOI 样本和图像之间的对象和谓词特征,并生成新的交互样本和新类型的 HOI,从而显著缓解了低样本或零样本的 HOI 检测问题。在 HICO-DET 和 V-COCO 数据集上的实验证明了该方法的有效性,并且在 HICO-DET 上优于最新的最优方法。
Jul, 2020
通过结构化文本知识,我们提出了一个系统且统一的框架 (RmLR) 来提高人物 - 物体交互检测,通过分析相互作用信息的损失并生成更全面的视觉表示,设计了更精细的句子 - 词级对齐和知识传递策略以有效解决多个交互和多个文本之间的匹配问题,进而提高了对交互的理解。实验结果表明我们的方法在公共基准测试上实现了最先进的性能,并进一步分析了我们方法的各个组成部分对效果的影响,为其功效提供了洞察。
Jul, 2023
采用自助学习技术的 “自我监督学习 over sets”(SOS) 方法,从视频数据的对象区域中提取表示对象的图像特征,结合自然数据转换过程中的时空连续性和对象集内在关系,实现了人物自身操作的行为识别,显著提升了多个最先进的视频分类模型的性能。
Apr, 2022
本文探讨了人 - 物体交互检测的两个挑战:类别不平衡和每图像多标签需求的有效解决方法,分别是通过对比分析 HOIs 语言嵌入来初始化权重和使用 LSE-Sign 损失加强多标签学习,从而实现了无需依赖物体检测和人体姿势检测的 HOI 分类,在集成现有物体检测模型后,达到了最先进的检测结果。
Dec, 2021
本研究提出了一个人 - 物交互全面了解的新任务,称为 HOI Concept Discovery,并针对该任务设计了自组合学习框架(或 SCL),该方法可以使学习在已知和未知的 HOI 概念上进行,并在多个数据集上展示了良好的效果。
Mar, 2022
ISA-HOI 是一种新颖的 HOI 探测器,它广泛利用了 CLIP 的知识,通过对视觉和文本特征之间的交互语义进行对齐,提取图像的全局上下文和物体的局部特征来改善图像中的交互特征,并且通过跨模态融合提高动词标签的文本特征,最终在较少的训练时期内在 HICO-DET 和 V-COCO 基准上取得了竞争性的结果,并在零样本设置下超越了最先进的方法。
Apr, 2024
提出了一种基于 transformer 的特征提取器,其中关注机制和基于查询的检测起着关键作用,可以避免多个 HOI 实例的特征混合,有效提取上下文重要特征,优于现有方法。
Mar, 2021
通过 Interpolation Consistency Training 的算法来对半监督学习场景下的深度神经网络进行训练,该算法促进了标记分布的一致性并在高可信度值下减少过度拟合。
Mar, 2019