MMJun, 2020

非平稳环境中的计算卸载在线算法

TL;DR本文提出一种基于乐观性策略的在线学习算法,用于解决任务卸载场景下的多臂老虎机问题,以实现最小化端到端延迟。研究结果表明,在动态环境中,严重贬低过去的奖励的重要性。该算法表现优于现有算法,优化效果高达约 1 秒。