BriefGPT.xyz
Ask
alpha
关键词
behaviours
搜索结果 - 2
开放环境中的持续演化奖励
在复杂的现实环境中,准确识别驱动实体行为的奖励是困难的,特别在环境改变时,由于目标和相关行为在内生地出现并动态更新。本文通过学习和期望的方式考察了一种用于动态更新奖励的候选算法 RULE。通过在简化的生态系统模拟实验中测试,该方法成功模拟了
→
PDF
2 months ago
自主智能体对其他智能体的建模:全面调查和未解决的问题
介绍人工智能领域中对于开发具有自主性并与其它实体有效交互的代理人的方法,重点讨论了不同建模方法及其基础方法学和前提条件,涉及方法学和实际应用,最后阐述了未来研究的潜在课题。
PDF
7 years ago
Prev
Next