Aug, 2024

潜在隐式神经网络:具有判别语义的视频隐式表示灵活框架

TL;DR本研究解决了视频隐式神经网络在缺乏语义信息下,无法支持后续任务的问题。通过提出一个灵活框架,将视频的时空特征解耦,利用学习到的每帧潜在特征与大型视觉模型对齐,从而实现压缩和视频检索的优异性能。最大的发现是,该方法不仅实现了高效压缩,还可用于视频插值等多种任务,开创了领域的新方向。