BriefGPT.xyz
Ask
alpha
关键词
language-guided reinforcement learning
搜索结果 - 2
LaGR-SEQ: 语言引导的强化学习与高效抽样查询
通过使用大型语言模型的预测能力,我们引入了 LaGR(语言引导的强化学习)和 SEQ(样本高效查询)两个框架,用于在部分完成的任务中提出解决方案,并同时降低对语言模型的查询次数,从而更高效地进行主要强化学习训练。
PDF
a year ago
ICLR
深度集合用于 RL 中的泛化
本文研究了在自然语言引导下的强化学习中,将以对象为中心的表现编码到奖励函数和策略架构中的想法。通过使用受深度集合启发的对象排列不变网络和门控注意机制的组合,我们在二维过程生成的世界中显示出这些结构对于分布外的目标具有强大的泛化能力,同时我们
→
PDF
4 years ago
Prev
Next