本研究提出了一种新的基于已有组件的网络结构用于快速学习视频压缩,针对现有方法的图形概率模型进行了分析并指出了实验评估中观察到的时间一致性和颜色偏移的问题,并提出了解决这些问题的方向。
Apr, 2020
使用生成模型进行压缩可提高失真度和视觉效果,对视频和图像压缩有效。相比传统的可变长度编码方案,生成压缩的鲁棒性更高,适应于噪声无线信道。
Mar, 2017
本文提出了一种基于深度生成模型的视频压缩方法,采用三维自编码器和自回归先验以最小化速率失真损失,实现编码效果优于现有的基于运动补偿或插值的视频压缩网络,并且在设计选择和压缩技术方面进行了系统评估和扩展,包括语义压缩、自适应压缩和多模态压缩,以便在非标准成像传感器捕获的多个模态数据上实现联合压缩。
Aug, 2019
本文通过将自回归生成模型与有损视频压缩任务联系起来,提出了一种基于机器学习的视频压缩方法。大规模视频数据的全面评估表明,在视频数据的压缩比率及失真质量上,该方法优于传统的基于机器学习和基于传统技术的方法。
Oct, 2020
本文提出了一种基于深度学习模型的视频压缩方法,其中利用神经网络的非线性表征能力和学习基于光流估计获取运动信息并重构当前帧的方法,同时采用两个 auto-encoder 风格的神经网络来压缩相应的运动和残差信息以共同优化所有组件,并通过单一损失函数来一起考虑减少压缩比特数和提高解码视频质量之间的权衡,实验证明该方法在 PSNR 方面优于广泛使用的 H.264 视频编码标准,在 MS-SSIM 方面甚至与最新的标准 H.265 相当。
Nov, 2018
本文提出了一种基于向量量化 (VQ) 的生成模型的图像压缩编码框架,通过学习 VQGAN 模型的码本可实现在潜空间内对连续信息进行高效压缩,从而在极低比特率下实现优质的重构图像。
Jul, 2023
本文提出了一种基于生成模型的视频压缩表示方法,它可以通过学习紧凑的潜在代码有效地表示和重构视频序列,并且在使用邻节点潜在代码的低秩和相似性约束进行正则化的情况下,可以从不同压缩率下的压缩测量中恢复各种视频信息。
Feb, 2019
我们提出了一个名为 CV-VAE 的视频 VAE 方法,通过与给定图像 VAE 进行潜在空间的兼容性来实现训练视频模型,并展示了其在视频生成和压缩方面的有效性。
May, 2024
本文系统、全面地回顾了基于神经网络的图像和视频压缩技术的发展现状及未来趋势。特别是,介绍了通过深度学习和 HEVC 框架实现的先进视频编码技术,并回顾了基于神经网络的端到端图像和视频编码框架,展示了他们在生成高效率信号表示结构方面的探索和未来的研究趋势。
Apr, 2019
我们提出了一种基于生成对抗网络(GANs)的神经视频压缩方法,它在用户研究中明显优于以前的神经和非神经视频压缩方法,并为神经方法的视觉质量设定了新的最新技术。我们表明 GAN 损失对于获得这种高视觉质量是至关重要的,并通过用户研究验证了这种方法的有效性。
Jul, 2021