BriefGPT.xyz
Jun, 2024
联合神经情境强化学习中的不确定性
Uncertainty of Joint Neural Contextual Bandit
HTML
PDF
Hongbo Guo, Zheqing Zhu
TL;DR
通过引入神经网络增强情境强化学习,本文提出了一种适用于大规模推荐系统的联合神经情境强化学习解决方案,该方案将所有推荐物品集成到一个单一模型中,并通过理论分析和实验结果揭示了超参数调整过程中的不确定性,为离线训练和在线部署提供了帮助。
Abstract
contextual bandit learning
is increasingly favored in modern
large-scale recommendation systems
. To better utlize the contextual information and available user or item features, the integration of
→