BriefGPT.xyz
Ask
alpha
关键词
rladapter
搜索结果 - 1
RLAdapter: 在开放环境中将大型语言模型与强化学习相结合
RLAdapter 通过引入一个适配器模型,在强化学习和大型语言模型之间建立更好的联系,通过在 RL 代理的训练过程中生成的信息来微调轻量级语言模型,从而在适应下游任务方面提供更好的指导,并在 Crafter 环境中实验表明 RLAdapt
→
PDF
9 months ago
Prev
Next