BriefGPT.xyz
Ask
alpha
关键词
computational agents
搜索结果 - 4
不确定激励一致下的紧急合作
不确定性降低了代理人在合作行为中的能力,但通过声誉机制和内在奖励可以增强合作环境中的代理人能力并大幅提升混合动机环境中的合作。
PDF
5 months ago
基于马尔可夫决策过程、实体嵌入和代理集成的上下文感知型代理策略组合
我们提出了一种基于仿真的新方法,通过知识图和实体嵌入来表示异构上下文,并使用并行运行的代理集合对需求进行上下文感知型策略的组合。在 “Virtual Home” 数据集上的评估表明,需要在不同上下文之间无缝切换的代理可以即时请求组合策略,以
→
PDF
10 months ago
关注力下的紧急通讯
研究计算代理人的注意机制如何更好地使用自己的新兴语言,展示注意力机制如何带来更组合和可解释的新兴语言,同时提高理解学习后的代理人间通信协议的途径。
PDF
a year ago
好奇心机器应该具备的五个特性,你不知道的
该研究对动物和机器好奇心进行了全面的、多学科的研究。研究人员提出了五个最重要的特点,包括 1)对非明显指示物的指向性,2)满足后停止,3)自愿接触,4)短暂,5)有条理的长期学习。此外,研究人员还展示了这些特性如何在强化学习代理中被实现,并
→
PDF
2 years ago
Prev
Next