BriefGPT.xyz
Ask
alpha
关键词
optimized bidding policies
搜索结果 - 1
优化生产投标策略的离线强化学习
通过离线强化学习从真实数据中学习,我们提出了一种通用方法来优化生产环境中的竞价策略,这种方法可以用于优化任何可微分的基础策略,并且只需要由基础策略自身生成的数据。我们使用混合代理架构将任意基础策略与深度神经网络结合起来,在训练后仅部署优化的
→
PDF
9 months ago
Prev
Next