BriefGPT.xyz
大模型
Ask
alpha
关键词
interactive environments
搜索结果 - 4
CivRealm: 文明中的学习和推理之旅用于决策智能体
通过 CivRealm 环境,本论文介绍了决策代理的学习和推理两个基本要素,以及在互动环境中学习和推理之间的平衡问题。
PDF
5 months ago
AgentBench: 评估语言模型为代理人
大型语言模型在互动环境中以多轮开放式生成的方式评估 LLMs 作为代理的推理和决策能力,显示出商业 LLMs 和开源竞争对手之间的性能差距。
PDF
a year ago
语言模型作为零 - shot 规划器:提取行动知识用于具身代理
本文研究大型语言模型在互动环境中是否可以利用所学的世界知识来执行高层任务,并提出了一种条件方法,将语言模型生成的中级计划语义上翻译为合适的操作以提高执行性能。在 VirtualHome 环境中的实证评估结果表明,该方法在可执行性方面显著优于
→
PDF
2 years ago
独立可控特征
本文旨在研究如何在交互环境中通过找出学习者可控制的因素来寻找控制观察数据变异因素的因素,提出了一种新颖的方法并在实验中进行了测试。
PDF
7 years ago
Prev
Next