BriefGPT.xyz
Ask
alpha
关键词
limited sensing
搜索结果 - 1
群体系统的引导深度强化学习
本文研究了如何使用有限的传感能力控制一组合作智能体,使用了基于演员 - 评论家算法的深度强化学习以近似 Q 值函数和策略评估,评估了在寻找和维持距离和定位目标方面的性能。
PDF
7 years ago
Prev
Next