BriefGPT.xyz
大模型
Ask
alpha
关键词
specialized student agent
搜索结果 - 1
大型语言模型作为训练强化学习智能体的良好策略导师
通过使用大规模语言模型,我们提出了一种新的框架,通过从语言模型教师代理接收指导行为,训练一个小规模专用的学生代理。通过将语言模型的先验知识融入到本地学生模型中,该学生代理可以用较少的数据进行训练,并通过环境反馈进一步提升其能力。实验结果表明
→
PDF
7 months ago
Prev
Next