May, 2024

生物神经元和深度强化学习在模拟游戏世界的样本效率上竞争

TL;DR生物系统与机器学习算法在完成任务所需样本数量上有何比较?通过将体外生物神经网络与最先进的深度强化学习算法在 “乒乓球” 游戏的简化模拟中进行学习效率对比,发现即使是简单的生物培养物在真实时间课程下,也比所有深度强化学习代理在各种游戏性能特征上具有更高的样本效率和更快的学习能力。