Jan, 2024

未见领域视频时刻检索的生成式视频扩散

TL;DR本研究通过利用目标领域的句子(文本提示)而无需访问其视频,探索生成式视频扩散来编辑源视频,实现未知领域的视频时刻检索(VMR)。通过两个问题的解决,即产生具有微妙差异的不同时刻的高质量模拟视频和选择与现有源训练视频互补的模拟视频,优化未知领域的 VMR。