BriefGPT.xyz
大模型
Ask
alpha
关键词
babyai
搜索结果 - 2
行动前先思考:将语言推理与行动交错的统一策略
提出了一种将 Transformer 模型与强化学习相结合,并在 BabyAI 任务上表现出色的新方法,其中模型输出既包含动作,也包含文本描述。
PDF
a year ago
MM
泛化基于 emergent 原理的通信
研究将最近开发的 BabyAI 网格世界平台转变为发送者 / 接收者设置,以测试深层强化学习技术是否足以激励建立通用代理之间的基于地面的离散通信协议的假设。结果表明,适当的环境激励确实可以避免测量或特殊归纳偏差的情况,而且更长的通信间隔激励
→
PDF
4 years ago
Prev
Next