Karma: 基于因果序列建模的自适应视频流媒体
在 Facebook 视频流平台,我们评估最新提出的基于 RL 的自适应比特率算法,采用可扩展的神经网络架构设计,利用贝叶斯优化进行奖励塑形,优化用户体验目标,以应对网络环境的随机性方差。在全球范围内超过 3000 万次视频流会话中,我们的 RL 方法优于现有的人工设计的算法。
Aug, 2020
用感知视频质量代替比特率,结合能量消耗、延迟等度量,提出 LL-GABR 深度强化学习算法,通过模拟实验结果验证其在感知 QoE 和能量效率上的优势。
Feb, 2024
本文介绍了一种基于传感器数据及深度强化学习的视频自适应码率算法(SA-ABR),适用于无人机的实时高清视频传输,无需对无人机状态或环境进行假设或建模,其平均体验质量奖励表现比现有技术提高了 21.4%。
Sep, 2019
提出了一种多模态时空注意力转换器来生成多个视点轨迹,基于多视点预测的多智能体深度强化学习 (MADRL) 的自适应比特率流媒体算法,用于在不同的网络条件下最大化不同的体验质量 (QoE) 目标,实验结果显示与现有的自适应比特率方法相比,提出的方法可将定义的 QoE 度量改善高达 85.5%。
May, 2024
用因果对等建模(CBM)方法在有因子的状态空间中学习动力学和奖励函数的因果关系,以得出最小的,任务特定的抽象。CBM 的隐式动力学模型可以在相同环境中重复使用,实验验证表明 CBM 的学习到的隐式动力学模型比显式模型更准确地识别了底层因果关系和状态抽象。此外,得出的状态抽象能够使任务学习者在所有任务上实现接近理想的样本效率,并在所有任务中优于基线模型。
Jan, 2024
本研究提出一种用于强化学习中的贝叶斯风险 MDP 问题的解决方法,旨在平衡鲁棒性和保守性。研究通过采用后验贝叶斯来估计转移模型,结合风险功能来控制模型的不确定性,并开发了多级贝叶斯风险敏感的 Q-learning 算法来解决问题。
May, 2023
本文介绍了一种机器人体系结构,它结合了概率图形模型和声明性编程的互补优势,用于表示和处理基于逻辑和概率的不确定性和领域知识。它采用行动语言描述了两个粒度水平上的紧密耦合的过渡图,通过求解部分可观察的马尔可夫决策过程,支持在复杂领域中处理默认违规、嘈杂观察和不可靠行为的推理和规划。
Aug, 2015
提出了一种基于场景图和深度学习的动作推理框架,通过先前的知识解释视频状态变化的语义级观察结果,该方法可以用逻辑规则和语义级变化观察结果解释其行动推理结果。
Aug, 2019
传统编解码器的自适应比特率 (ABR) 一旦做出决策后无法进一步修改,且选择的比特率可能过于保守或过于激进,而神经网络表示法 (NeRV) 可以将视频内容嵌入神经网络权重,实现不完整模型下的视频重建,为视频传输的自适应比特率策略的开发铺平了道路。本文提出了一种名为 Evolutional Video streaming Adaptation via Neural representation (EVAN) 的新框架,它能够通过使用软演员 - 评论家 (SAC) 强化学习自适应地传输 NeRV 模型,并采用渐进播放来避免重新缓冲,实验结果表明,EVAN 能够比现有的 ABR 方法减少 50% 的重新缓冲,并实现近 20% 的性能提升。
Apr, 2024
Mobile streaming video is often affected by the unstable bandwidth of modern wireless networks resulting in playback interruptions; this paper proposes a machine learning framework called Video ATLAS, which combines several quality-related features to predict users' quality of experience and provides improved performance over existing metrics while generalizing well on different datasets, enabling cost-effective adaptive network strategies.
Mar, 2017