BriefGPT.xyz
Ask
alpha
关键词
learner models
搜索结果 - 1
面向基于文本的教育环境的通用智能体: RL 与 LLMs 的整合研究
通过将强化学习与大型语言模型结合,研究了在开放性文本学习环境中增强代理的泛化能力,提出了三种代理类型:基于强化学习的代理、基于大型语言模型的代理和融合两者的混合代理,以提高代理的性能和泛化能力,并通过 PharmaSimText 提供的基准
→
PDF
2 months ago
Prev
Next