Dec, 2023

FlashVideo:快速从文本生成视频的框架

TL;DRFlashVideo 是一种新颖框架,通过使用 RetNet 架构,将序列长度为 L 的推理时间复杂度从 O (L^2) 降低到 O (L),从而显著加快推理速度,并且通过抛弃冗余帧插值方法来增强帧插值的效率,实现了相对传统自回归转换模型的 9.17 倍效率提升,并且推理速度与基于 BERT 的转换模型相当。