BriefGPT.xyz
Ask
alpha
关键词
reward system
搜索结果 - 2
通过模拟出生和死亡来演化食物和动作的奖励
通过模拟进化奖励功能并研究环境条件如何影响进化奖励函数的形状,本研究发现奖励系统中存在对食物获取的正向奖励和对运动行为的负向奖励,但运动行为的奖励出现了两种模式:相当正向和稍微负向,并指出在贫瘠和有毒食物环境下,奖励为次要食物的进化不稳定,
→
PDF
15 days ago
合作人工智能
本研究探讨了人工智能和博弈论的交叉领域,通过设计自动学习规则和设置奖惩机制来实现良好的社会合作,致力于构建一个合作型人工智能的研究目标。
PDF
2 years ago
Prev
Next