BriefGPT.xyz
大模型
Ask
alpha
关键词
text-video alignment
搜索结果 - 3
CoCoCo:改进文本引导的视频修复以提升一致性、可控性和兼容性
本文提出了一种新颖的文本导向的视频修复模型,实现了更好的一致性、可控性和兼容性。实验表明,该模型能够生成高质量的视频片段,并展示了更好的动作连贯性、文本可控性和模型兼容性。
PDF
4 months ago
像素与潜在扩散模型在文字到视频生成中的融合
本文提出了一个混合模型,名为 Show-1,结合了基于像素和基于潜变量的文本到视频扩散模型,以实现精确的文本 - 视频对齐和高质量视频生成。
PDF
9 months ago
CVPR
利用非对齐文本进行弱监督视频表示学习
本文提出了一种基于 transformer,支持弱监督下视频理解的方法,主要包括多粒度损失函数、伪造的帧 - 句对应关系等。在视频序列验证和文本匹配实验中表现良好。
PDF
a year ago
Prev
Next