BriefGPT.xyz
Ask
alpha
关键词
long-term satisfaction
搜索结果 - 1
KDD
不耐烦赌徒:无需延迟的长期优化
在在线平台中,推荐系统是一个普遍存在的功能,越来越多地被明确要求增加用户的长期满意度。本研究主要关注内容探索任务,将其形式化为一个带有延迟奖励的多臂赌博问题。我们观察到在选择学习信号时存在明显的权衡:等待全部奖励可用可能需要几个星期,从而影
→
PDF
a year ago
Prev
Next