BriefGPT.xyz
大模型
Ask
alpha
关键词
allocation strategy
搜索结果 - 2
基于模型的约束 MDP 在序列激励营销中的预算分配
本文提出采用 CMDP 框架和模型规划相结合的学习算法,解决了在线商业活动中如何高效地分配奖励从以往的历史订单数据中学习策略的问题。实验结果表明了本方法的有效性。
PDF
a year ago
WWW
Cross DQN:用于 Feed 广告分配的跨网络深度 Q 网络
本文提出了 Cross Deep Q Network(Cross DQN)的模型,通过交叉不同物品的嵌入来提取重要的排列信号并通过多通道注意力建模。此外,我们提出了一种辅助损失来处理广告暴露率的批级约束,以在保持个性化推荐的同时将广告暴露率
→
PDF
3 years ago
Prev
Next