Sep, 2023

多拷贝强化学习代理

TL;DR该论文研究了一种新型的多智能体问题,其中一个智能体通过复制自身来更好或更高效地完成单一智能体任务。我们提出了一种学习算法,用于解决多重复制问题,它利用价值函数的结构有效地学习如何平衡添加额外复制的优势和成本。