ICMLJan, 2021

使用目标网络打破致命三角

TL;DR本文研究了使用目标网络作为打破致命三元组的工具,提出了一种新的目标网络更新规则,并在多个离散算法中应用目标网络和岭回归来证明其收敛性。