Jun, 2024

联合神经情境强化学习中的不确定性

TL;DR通过引入神经网络增强情境强化学习,本文提出了一种适用于大规模推荐系统的联合神经情境强化学习解决方案,该方案将所有推荐物品集成到一个单一模型中,并通过理论分析和实验结果揭示了超参数调整过程中的不确定性,为离线训练和在线部署提供了帮助。