BriefGPT.xyz
Ask
alpha
关键词
adversarial bandit setting
搜索结果 - 2
针对性营销的赌徒式利润最大化
该研究针对具有不同需求曲线的顺序盈利最大化问题,考虑价格和市场支出等附属变量的优化,提出了接近最佳的算法,并给出了不同类型需求曲线的后悔上限。
PDF
5 months ago
在带有上限的隐式探索下,插值 softmax 策略梯度和神经复制动力学
论文介绍了一种名为神经复制动力学(NeuRD)的算法,通过引入隐式探索算法来构建 NeuRD-CIX 算法,并在序贯决策制定中展示了它的性能。
PDF
2 years ago
Prev
Next