BriefGPT.xyz
Ask
alpha
关键词
online user-agent interacting environment simulator
搜索结果 - 1
基于深度强化学习的列表推荐
本文提出一种通过模型驱动的增强学习方法来不断优化推荐策略的推荐系统,将用户与推荐系统之间的交互建模为马尔可夫决策过程,并通过在线用户 - 代理交互环境模拟器来预训练和评估模型参数,进一步提出了一种将列表式推荐纳入推荐系统的实验方法,并在真实
→
PDF
7 years ago
Prev
Next