Dec, 2020

使用深度生成模型的低带宽视频聊天压缩

TL;DR通过使用发送方提取的面部标志在接收方设备上真实重建面孔的方式,我们探讨和评估了几种深度对抗方法的优点和缺点,同时设计了一种基于 SiSiSiiarasdyet.Firdmeodmel 法的移动兼容架构,并借助 SPADE 块在重要区域(如眼睛和嘴唇)中优化结果。我们将网络压缩到约 3MB,使模型可在 iPhone 8(CPU)上实时运行。这种方法使视频通话速度低于几 kbits / 秒,比当前可用的替代方案低一个数量级。