BriefGPT.xyz
Ask
alpha
关键词
text-based video segmentation
搜索结果 - 2
CVPR
基于多模态特征的文本视频分割运动建模
本文提出了一种多模态视频分割方法,通过语言引导的特征融合模块和多模态对齐损失函数,将视觉外观、运动信息和语言特征融合,实现了精准的文本视频分割。在 A2D Sentences 和 J-HMDB Sentences 数据集上的实验表明,该方法
→
PDF
2 years ago
文本视频分割的演员和行为模块化网络
本文提出了一种基于文本的视频分割方法,通过引入一个新的演员和动作的模块化网络,解决了语义不对称问题,同时提出了时间提案聚合机制,获得了单帧分割和全视频分割的最先进性能。
PDF
4 years ago
Prev
Next