BriefGPT.xyz
Ask
alpha
关键词
temporal grounding accuracy
搜索结果 - 2
一种简单而有效的视频时间对齐方法,具有交叉模态注意力
本文主要研究了利用语言引导定位视频中的相关片段的问题,提出一种简单直观的跨模态注意力模块 (CMA) 和针对此任务的新回归损失函数来提高定位精度,并在 Charades-STA 和 ActivityNet Captions 数据集上超越了目
→
PDF
4 years ago
视频中基于语义条件的时序句子 grounding 的动态调节
本文提出了一种基于语义条件动态调制机制的匹配算法,该算法依赖于句子语义来调节时间卷积操作,从而更好地对视频内容进行时间上的关联和组合,进而提高了句子与视频的匹配关系,提高了视频句子定位的准确度。
PDF
5 years ago
Prev
Next