Jul, 2024

可持续觅食问题的在线学习时间依赖性

TL;DR可持续觅食问题是一个多智能体环境试验平台,探索智能体处理社会困境中的认知形式,需要通过觅食抵制个体奖励的诱惑并选择集体的长期可持续目标。我们研究了神经进化和深度递归 Q 网络在线学习的方法,使智能体可以像所需的恶性社会问题一样尝试解决问题。我们进一步探讨了利用长短期记忆学习时间依赖性是否能够帮助智能体开发长期的可持续觅食策略。研究发现,长短期记忆的整合帮助智能体开发了单个智能体的可持续策略,但未能帮助智能体处理多智能体场景中出现的社会困境。