基于实时深度学习的 H.264 控制器通过动态估算最优的编码器参数来维持视频质量,并在最小化压缩视频的平均比特率的同时实现高达 2.5 倍的带宽使用改善,且非符合概率低于 10^-2。
Nov, 2023
本文提出了一种基于深度学习模型的视频压缩方法,其中利用神经网络的非线性表征能力和学习基于光流估计获取运动信息并重构当前帧的方法,同时采用两个 auto-encoder 风格的神经网络来压缩相应的运动和残差信息以共同优化所有组件,并通过单一损失函数来一起考虑减少压缩比特数和提高解码视频质量之间的权衡,实验证明该方法在 PSNR 方面优于广泛使用的 H.264 视频编码标准,在 MS-SSIM 方面甚至与最新的标准 H.265 相当。
Nov, 2018
提出了一种实时基于深度学习的 H.264 控制器,利用即时的信道质量数据和视频块动态估计最优的编码器参数,以保持编码视频的比特率略低于可用信道比特率,验证了该方法在视频质量上相较于最先进的自适应比特率视频流媒体有 10-20 dB 的改进,平均数据包丢失率低至 0.002。
Sep, 2023
本文研究了在深度视觉模型中使用标准编解码器的影响,发现使用 JPEG 和 H.264 编码会显著降低各类视觉任务和模型的准确性,特别是在语义分割准确度上降低了超过 80%。与以往研究不同的是,我们的分析扩展到图像和动作分类以外的领域,提供了更全面的观点。
Apr, 2024
我们提出了一种 ML-based 的视频编码算法,通过评估不同分辨率和基于商业编解码器的标准视频压缩测试集发现,在低延迟模式下相对于 HEVC/H.265, AVC/H.264 和 VP9,我们的算法通常产生更小的代码。并且,我们的方法不会出现图块失真和像素化,可以产生更加视觉上令人愉悦的视频。
我们引入了一种创新的编码器控制器,它具有模式预测和图片组选择模块,通过在编码阶段集中控制,使得在不同任务中可以进行可调的编码器调整,同时保持与标准预训练深度视频压缩解码器的兼容性。实证数据表明,我们的方法适用于多个任务且适用于多个现有的预训练深度视频压缩解码器,而且广泛实验表明,我们的方法对于不同任务的比特率优于以前的深度视频压缩方法,仅需一个预训练解码器。
我们提出了一种全新的视频编码系统,基于条件编码的概念构建,其基础层支持机器视觉任务,而其增强层支持人类视觉重建,实验证明在基础层上,我们的框架优于现有的学习型视频编码和传统视频编码,并且在增强层上有可比性的性能。
Jul, 2023
本研究提出了一种基于学习的分层双向视频编解码器,结合分层运动预测和端到端优化,实现了目前为止在 PSNR 和 MS-SSIM 上报告的学习视频压缩方案的最佳 R-D 结果,相对于传统视频编解码器,在 PSNR 和 MS-SSIM 以及 HM16.23 参考软件的 MS-SSIM 上性能均优于 x265 和 SVT-HEVC 编码器的 R-D 性能。
Dec, 2021
文章提出了一种基于深度生成模型和序列数据的变分自编码器模型,用于视频压缩,经测试取得了竞争性的压缩效果。
Oct, 2018
论文提出了一种基于深度学习的分布式视频编码架构,通过在解码器中使用有效的辅助信息生成模块,成功利用帧间相关性以提高压缩效率,同时,在编码速度相同的情况下,研究结果优于传统的分布式编码和基于 H.264 标准的压缩方法。
Mar, 2023