BriefGPT.xyz
Ask
alpha
关键词
proposal-free framework
搜索结果 - 2
DiffusionVMR:视频时刻检索的扩散模型
该研究提出了一种名为 DiffusionVMR 的提议无关框架,通过将视频时刻检索重新构想为去噪生成过程,直接从噪声中采样随机时段作为候选,并引入去噪学习以确定目标时刻。实验证明 DiffusionVMR 相比现有方法具有更高的效果。
PDF
10 months ago
ViGT:在 Transformer 模型中具有可学习令牌的无需提议的视频定位
基于视觉和语言描述,本研究提出了一种新的边界回归范式来定位视频中的行为或事件,通过一个可学习的回归标记来预测时间边界,而非跨模态特征,取得了良好的效果并得到了进一步验证。
PDF
a year ago
Prev
Next