BriefGPT.xyz
Ask
alpha
关键词
language-conditioned reinforcement learning
搜索结果 - 2
对比语言、动作和状态预训练用于机器人学习
本文介绍了一种名为 Contrastive Language, Action, and State Pre-training (CLASP) 的方法,采用分布式输出使文本命令和行为单元之间的对齐变得更加准确,从而帮助了解决机器人学习中的相关
→
PDF
a year ago
lilGym:利用强化学习进行自然语言视觉推理
lilGym 是一个基于自然语言生成环境的强化学习基准,通过在每个可能世界状态上注释所有语句以确切计算奖励,创建了数千个不同难度的马尔可夫决策过程,并使用不同模型和学习体系结构实验和分析表明,lilGym 是一个具有挑战性的开放问题。
PDF
2 years ago
Prev
Next