BriefGPT.xyz
Ask
alpha
关键词
generalist agent
搜索结果 - 6
通过功能奖励编码的无监督零样本强化学习
我们提出了一种功能奖励编码(FRE)作为零样本强化学习问题的一种通用、可扩展的解决方案,通过使用基于变分自编码器的变压器,学习任意任务的功能表示,从而在大量无标签离线轨迹上预先训练一般性代理,以零样本方式适应任何新的下游任务。
PDF
4 months ago
读动即玩(R2-Play):多模态游戏指令决策转换器
本文针对人工智能中发展通用型代理的目标,研究了多任务学习和决策网络以及多模态游戏指令对代理的指导与改进作用,并通过实验证明多模态游戏指令的引入显著提升了决策变换器在多任务和泛化能力方面的表现。
PDF
5 months ago
走向学习通用模型的行动导航
利用基于模式的指令将 LLMs 整合到具有身体导航功能的第一个通用模型 NaviLLM 中,该模型在各种任务中取得了最新的成果,并在 CVDN、SOON 和 ScanQA 上的性能达到了最新发展水平。
PDF
7 months ago
三维环境中的具身综合应用智能体
利用大规模知识和学习方案以及大型语言模型(LLM),最近的机器学习模型在构建通用性代理人方面取得显著成功,表现出在不同领域(包括自然语言处理、计算机视觉和机器人技术)解决通用任务的能力。然而,这些模型在理解和与三维世界交互方面仍存在显著挑战
→
PDF
8 months ago
模仿就是全部吗?双阶段训练下的广义决策制定
DualMind 使用新颖的 “双阶段” 训练策略来解决现有方法所提出的挑战,可以处理跨领域,场景和具体体现的任务,并在 MetaWorld 和 Habitat 上进行了广泛的评估和实验,其表现优于其他广义智能体,MetaWorld 上成功
→
PDF
a year ago
通用智能体
本研究基于大规模语言模型的进展,采用类似方法构建了一个跨越文本输出领域之外的单一通用智能体,称为 Gato,它作为一个多模态、多任务、多具象化的通用策略工作。相同的网络和相同的权重可以同时用于打 Atari 游戏、描述图像、聊天、使用真实机
→
PDF
2 years ago
Prev
Next