BriefGPT.xyz
Ask
alpha
关键词
video instruction diffusion
搜索结果 - 1
VIDiff: 多模态指令扩散模型的视频翻译
我们提出了 Video Instruction Diffusion(VIDiff),这是一个统一的基础模型,专为广泛的视频任务设计,包括理解任务(如语言引导的视频对象分割)和生成任务(视频编辑和增强)。我们的模型可以根据用户指令在几秒钟内编
→
PDF
7 months ago
Prev
Next