关键词population-based approaches
搜索结果 - 2
- 使用基于模型的品质多样性和梯度的高效探索
本文介绍了一种基于模型的 Quality-Diversity 算法,该算法通过对所有群体成员进行有效的探索和利用想象中的扰动来同时维持性能和高效的多样性,从而提高人群算法在具有欺骗性奖励的任务中的样本效率和解决方案质量。
- 使用自然语言的动态基于人群的元学习,用于多智能体通信
使用动态人口元学习方法来训练代理人在涉及自然语言的多智能体通信环境中与已知、未知和人类伙伴协调。在两个不同的基准博弈中进行了全面评估,并显示出我们的方法在与人类合作时优于所有先前的工作。