Jun, 2024

SMC++:无监督视频语义压缩的遮蔽学习

TL;DR该论文提出了一种基于遮罩视频建模的压缩框架,特别是针对视频语义进行压缩,通过自监督学习方式联合挖掘和压缩语义。提出的框架作为简单的语义挖掘与压缩模型,并通过引入遮罩运动预测目标和基于 Transformer 的压缩模块进行扩展,实现更好的语义学习能力和压缩效果。实验结果表明,该模型在三个视频分析任务和七个数据集上比传统的视频编解码器表现更卓越。