Jul, 2018

群体系统的深度强化学习

TL;DR提出了一种基于分布的平均嵌入(mean embeddings)状态表示法,适用于具有大量同质代理的群集系统;在深度多智能体强化学习中利用神经网络方式实现的平均嵌入表示法可实现最丰富的邻近智能体信息交换,促进更复杂的集体策略的发展。