Jul, 2024

LaSe-E2V:面向语言引导的语义感知事件到视频重建

TL;DR使用语言导向的途径,结合条件扩散模型,提出一种名为LaSe-E2V的新框架,实现语义感知的高质量事件到视频重构;通过事件引导的时空关注模块、事件感知的掩膜损失和噪声初始化战略,确保重构的时空一致性和空间连贯性。在三个数据集上进行的广泛实验表明了我们方法的优越性。