IJCAIMay, 2018

冰球中基于上下文的球员评估的深度强化学习

TL;DR本论文提出了一种基于深度强化学习(DRL)的新方法来捕捉游戏背景,该方法使用 3M NBA 比赛的 play-by-play 事件来学习一个行动价值 Q 函数,并引入一种新的游戏影响度量(GIM)来评估玩家的整体表现。评估结果表明,GIM 在整个赛季中保持一致,并与标准成功指标和未来薪资高度相关。