AAAINov, 2019

带有 λ 回报的未校正最小二乘时序差分的补充材料

TL;DR本文提供了 Takayuki Osogami 关于 “未经校正的最小二乘时间差分与 lambda 回报” 的补充材料,发表在第 34 届 AAAI 人工智能会议上。