BriefGPT.xyz
Ask
alpha
关键词
multimodal videos
搜索结果 - 3
面对面对比学习用于社交智能问答
本文提出了一种名为 Face-to-Face Contrastive Learning (F2F-CL) 的图神经网络模型,用于建模人类社交互动中的面对面交流动态,并在 Social-IQ 数据集上实现了最先进的效果。
PDF
2 years ago
在复杂故事中建模情感:斯坦福情感叙事数据集
本文通过时间序列建模和高质量数据集的采集来建立动态情感刺激的模型,在此基础上介绍第一版本的斯坦福情感叙述数据集(SENDv1)。该数据集是自我节奏、非手稿的丰富、多模态视频,标注情感质量随时间的变化,为情感计算的当代时间序列方法提供了挑战,
→
PDF
5 years ago
ECCV
使用特权模态进行行为检测的图形蒸馏
本研究提出一种称为图蒸馏的方法,该方法在多模态视频中处理行动检测,其中仅有有限的训练数据和部分观察到的模态可用,并通过在源域中的大规模多模态数据集中使用丰富的特权信息来提高目标域的学习效果,从而克服了训练和测试之间的模态差异,并在 NTU
→
PDF
7 years ago
Prev
Next