Jul, 2024

深度强化学习在序列组合拍卖中的应用

TL;DR针对顺序组合拍卖的收益优化拍卖设计问题,本研究提出了一种新的强化学习框架,利用一阶梯度改进了传统的计算方法并在复杂实际拍卖场景中取得了显著的收益改善。