Jun, 2024

通过模拟出生和死亡来演化食物和动作的奖励

TL;DR通过模拟进化奖励功能并研究环境条件如何影响进化奖励函数的形状,本研究发现奖励系统中存在对食物获取的正向奖励和对运动行为的负向奖励,但运动行为的奖励出现了两种模式:相当正向和稍微负向,并指出在贫瘠和有毒食物环境下,奖励为次要食物的进化不稳定,而对正常食物的奖励仍然稳定,这些结果证明了模拟环境和能量依赖的出生和死亡模型在奖励系统起源研究中的实用性。