BriefGPT.xyz
Ask
alpha
关键词
skill set optimization
搜索结果 - 1
技能集优化:通过可转移技能强化语言模型行为
通过构建和优化一组可迁移技能,我们提出了技能集优化(Skill Set Optimization,SSO)来提高大型语言模型在交互环境中的决策性能。在这种方法中,SSO 通过提取具有高奖励的共同子轨迹,并生成子目标和指示来构建技能。这些技能
→
PDF
5 months ago
Prev
Next