Feb, 2018

深度强化学习的结构控制网络

TL;DR本文提出了一种名为Structured Control Net的新型神经网络架构,将通用的MLP拆分为非线性控制模块和线性控制模块,以利用线性和非线性策略的两者优点并改善训练样本效率、最终奖励和学习策略的泛化能力。该结构在来自OpenAI MuJoCo、Roboschool、Atari和自定义的2D城市驾驶环境的竞争性模拟测试中有竞争力的结果,并具有将特定问题先验导入网络架构来改进广泛控制任务的潜力。