BriefGPT.xyz
Ask
alpha
关键词
value maximization
搜索结果 - 2
ICLR
强化学习中的时间协调探索的生成规划
通过生成式规划方法可以更有效地进行值最大化的策略优化,从而实现对多步骤动作的生成和增强,进而提高探测效率和行动反应的自适应性。
PDF
2 years ago
WWW
机制设计中的灰姑娘问题
GSP auction succeeded due to advertisers' value maximization preferences for truthful auction pricing, supporting the br
→
PDF
7 years ago
Prev
Next