Aug, 2017

LADDER:大规模实时在线拍卖的人类水平竞价代理

TL;DRLADDER 是一种基于 DASQN 的异步随机算法的深度强化学习代理,它能够成功地直接从包含高级语义信息的原始输入中学习大规模实际问题的控制策略,这种代理用于在线竞拍和广告领域,可以显著地提高公司的广告收益和广告主的投资回报率。