zero-shot action recognition | BriefGPT

关键词zero-shot action recognition

搜索结果 - 15

MM零样本基于骨架的动作识别的信息补偿框架
从信息论的角度设计信息补偿学习框架，通过多粒度语义交互机制来提高零样本动作识别准确性，并提出多层次对齐方法对动作类别的信息进行补偿，利用新的损失函数采样方法获得紧密且鲁棒的表示，进而通过合成多粒度语义嵌入形成适当的分类决策面，验证多粒度语义
PDFa month ago
基于文本的三维人体动作检索的跨数据库研究
我们提供了一项关于基于文本的三维人体动作检索的研究结果，重点关注跨数据集的泛化问题。通过采用统一的 SMPL 人体格式，我们能够对一个数据集进行训练，对另一个进行测试，或者对多个数据集进行训练。研究结果表明，标准的文本 - 动作基准数据集（
PDFa month ago
基于对象任务的零样本多标签动作识别中的组合性影响
提出了 Dual-VCLIP 方法，以应对动态环境中机器人在与人类合作的任务中多标签动作识别的挑战，特别是涉及物体的任务。该方法在训练过程中仅学习两个提示，因此比其他方法更简单，通过在 Charades 数据集上验证了其性能，在完整数据集上
PDF2 months ago
ActionHub：大规模动作视频描述数据集用于零样本动作识别
利用视频标题进行丰富的跨模态和跨行动建模，提出了 CoCo 框架，包括双重跨模态对齐模块和跨行动不变性挖掘模块，并通过动作描述数据集 ActionHub 在零样本行动识别 (ZSAR) 的三个热门基准测试中实现了明显的效果优于。我们的 Co
PDF5 months ago
CVPR跨模态表示学习用于零样本动作识别
本篇研究提出了一种基于跨模态 Transformer 的框架，用于零样本动作识别，其将视频数据和文本标签进行联合编码，并通过一个新的管道来构建视觉和语义表示之间的共享知识空间，其中包括了一个语义传递的策略，通过将已有和未见的课程联合在一起，
PDF2 years ago
针对零样本动作识别的端到端语义视频变换器
本文提出了一种新的端到端训练 Transformer 模型的方法，能够高效地捕捉长期时空依赖性，在零样本学习方面获得了最新进展，通过避免训练和测试类之间的重叠，提出了一个新的实验设置方案，该方法在 UCF-101、HMDB-51 和 Act
PDF2 years ago
从多样化的物体场景组合中的零样本行为识别
本研究提出了基于物体和场景组成误差与多样性要求的无监督零样本动作识别方法，该方法不需要已训练的视频集，能够有效地提高动作识别效果。
PDF3 years ago
ICCV零样本动作识别的详细排练
本文提出了一种基于 Elaborative Rehearsal 技术的 ER-enhanced ZSAR 模型，该模型使用 Elaborative Description 和 Elaborative Concepts 来扩展动作类别以及提高
PDF3 years ago
一种用于真正零样本动作识别评估的新分割方法
该论文针对零样本行为识别中的现有问题，提出了 True Zero-Shot (TruZe) 数据集，其中训练集、测试集和预训练类别没有任何重叠，对零样本行为识别任务进行了评估，并发现在该任务中未见类别性能普遍较低，实验结果也暗示少样本行为识
PDF3 years ago
ECCV利用强化学习进行聚类的零样本动作识别 (CLASTER)
本研究提出了一种名为 CLASTER 的基于质心的零样本行动识别方法，它通过聚类视觉和语义向量表征，并通过强化学习进行聚类优化，有效实现了对新类别的识别。实验结果表明该方法在多个标准数据集上均优于现有算法。
PDF3 years ago
视频零样本动作识别：一项调查
本论文介绍了零样本动作识别在视频方面的研究现状，总结了可视化特征提取和语义特征提取的方法，并提供了完整的数据集、实验和协议描述，指出了未来工作的方向。
PDF5 years ago
TARN: 时间注意力关系网络用于少样本和零样本动作识别
本文提出了一种基于时间注意力关系网络的方法，通过利用注意力机制执行时间对齐，并在视频片段级别上学习深度距离度量，从而在少样本和零样本动作识别方面取得了优越的实验结果。
PDF5 years ago
CVPR泛零样本行为识别的非分布检测
本文提出了一种基于超出分布检测器的广义零样本学习框架，以解决零样本行为识别中的问题。我们使用生成式对抗网络合成了新的动作类别特征，并将其用于训练检测器。实验证明，该方法在三个数据集上的性能优于基准模型（f-CLSWGAN），分类准确率分别提
PDF5 years ago
ECCV视频和文本的跨模态和分层建模
本文探讨了多模态序列数据的建模技术，提出了一种通用模型，即基于层次结构的序列嵌入模型 (HSE)，该模型将不同模态的序列数据嵌入层次语义空间中，取得了超越现有方法的结果，并在零样本动作识别和视频字幕自动生成等下游任务中取得了更好的效果。
PDF6 years ago
零样本和少样本动作识别的生成式方法
本文提出了一种零样本动作识别的生成性框架，该框架基于建模每个动作类，使用代表该动作类的属性向量的概率分布的参数的函数。特别地，我们假设视觉空间中任何动作类的分布参数都可以表示为一组基向量的线性组合，其中组合权重由动作类的属性给出。这篇文章的
PDF6 years ago