BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-task environment
搜索结果 - 2
ICML
元强化学习的附带简易具身语言学习
该研究探讨了机器学习模型是否能够通过非语言任务间接学习语言,设计了一个含有变化语言环境和目的地的综合任务环境,通过元强化学习算法,培养出能够正确理解渐新语言和 floor plans 的智能体。
PDF
a year ago
ICML
强化学习中将语言与实体、动态相结合以实现概括
本文研究了利用自然语言来推动控制策略的泛化,并引入了一个新的多任务环境 Messenger,其中包括自由形式的文本手册,描述环境动态。使用实体 - 条件的注意力模块,作者提出了一个新的模型 EMMA,它可以从文本到观察值学习实体和动态之间的
→
PDF
3 years ago
Prev
Next