BriefGPT.xyz
Ask
alpha
关键词
transferable skills
搜索结果 - 2
技能集优化:通过可转移技能强化语言模型行为
通过构建和优化一组可迁移技能,我们提出了技能集优化(Skill Set Optimization,SSO)来提高大型语言模型在交互环境中的决策性能。在这种方法中,SSO 通过提取具有高奖励的共同子轨迹,并生成子目标和指示来构建技能。这些技能
→
PDF
5 months ago
元学习参数化技能
本研究提出了一种新的参数化技能学习算法,此算法可以学习可转移的参数化技能并将其综合到新的行动空间中,从而支持长视深远任务的高效学习。经实证表明,这种方法可以使代理人解决一组困难的长视深远任务。
PDF
2 years ago
Prev
Next