May, 2023

合作者网络:一般化和扩展

TL;DR本论文提出了一种使用coagent网络的强化学习框架,与传统的基于反向传播的深度学习框架相比,该框架具有更高的灵活性和可扩展性,并可以使用非可微分部件和学习高级探索策略。作者进一步研究了使用该框架时更新方差较高的问题,并在高维状态和动作空间下探讨了该框架的可观性。