BriefGPT.xyz
大模型
Ask
alpha
关键词
video retrieval datasets
搜索结果 - 2
NIPS
文本自适应的多视觉原型匹配用于视频检索
本文提出了一种文本自适应多视觉原型匹配模型,通过自适应聚合视频标记特征来描述视频,以解决视频和文本之间的关联模糊问题,而且此方法表现优于当前公共视频检索数据集上的最新技术。
PDF
2 years ago
CVPR
如何进行细粒度行为理解:利用伪副词
本研究提出一种半监督学习方法来识别动词的副词,用于了解不同行为之间微小的差异,具有很强的实证效果。
PDF
2 years ago
Prev
Next