BriefGPT.xyz
Ask
alpha
关键词
intrinsic motivations
搜索结果 - 3
DeepThought:自主自律系统的架构
通过将大型语言模型与深度学习系统整合,提出能够展示类似于代理、自我激励甚至一些元认知特征的认知语言代理体系结构。
PDF
8 months ago
多智能体强化学习中避免重复探索
在多智能体强化学习领域,内在动机作为一种重要的探索工具已经出现。我们提出了一种动态奖励缩放方法,以应对神经网络统计近似器的有限表达能力所带来的挑战,并有效控制多次重复访问任务空间的现象,在 Google Research Football
→
PDF
a year ago
具有非稳态相互依赖关系的自主开放式任务学习
该论文提出了一种基于马尔可夫决策过程的分层架构,使用内在动机最大化机器人学习多个具有关联性目标的能力,并提出了一种新的系统 H-GRAIL 来记录自主获取的任务序列,以能够在非稳态情况下修改它们。
PDF
2 years ago
Prev
Next