Feb, 2016

使用深度分布式递归 Q 网络学习通信以解决谜题

TL;DR提出深度分布式循环 Q 网络(DDRQN),使用強化学习训练多智能体自主学习协作中的沟通协议,实现自行决定并达成一致的沟通协议来解决协作问题,成功地建立一个漂亮且有效的沟通协议是其突出贡献。