Aug, 2020

采用强化学习的实时视频调整

TL;DR在 Facebook 视频流平台,我们评估最新提出的基于 RL 的自适应比特率算法,采用可扩展的神经网络架构设计,利用贝叶斯优化进行奖励塑形,优化用户体验目标,以应对网络环境的随机性方差。在全球范围内超过 3000 万次视频流会话中,我们的 RL 方法优于现有的人工设计的算法。