Aug, 2022

隐式双塔策略

TL;DR该论文提出了一种新的结构强化学习策略架构,Implicit Two-Tower(ITT)策略,并在OpenAI Gym和DeepMind Control Suite的15个环境上进行了测试,表明ITT-architectures特别适用于黑盒/进化优化,并且相应的策略训练算法优于其未经结构化改进的隐式对照组以及常用的显式策略。