BriefGPT.xyz
Ask
alpha
关键词
nlvl
搜索结果 - 3
多尺度二维时间地图扩散模型用于自然语言视频定位
自然语言视频定位(NLVL)是视频理解中复杂但关键的任务之一,本研究提出了一种旨在解决全局捕获视频数据时空动态的 NLVL 新方法,通过条件去噪扩散过程直接生成全局 2D 时空图。多尺度技术和创新的扩散解码器克服了 2D 时空图的稀疏性和不
→
PDF
6 months ago
AAAI
零样本自然语言视频定位中的常识
本文研究了零样本自然语言视频定位(NLVL)中常识推理的有效性,并提出了一个名为 CORONET 的零样本 NLVL 框架,利用常识知识图谱,通过常识增强模块来弥合视频和生成的伪查询之间的差距。通过对两个基准数据集的实证评估,证明 CORO
→
PDF
6 months ago
ACL
MS-DETR:使用采样时刻交互实现自然语言视频定位
本文旨在解决 Natural Language Video Localization(NLVL)的问题,通过提出 Moment Sampling DETR 算法,即基于提议的解决方案,生成候选时刻,并选择最佳匹配提议,同时使用可学习的模板进
→
PDF
a year ago
Prev
Next