BriefGPT.xyz
Ask
alpha
关键词
imaginary rollouts
搜索结果 - 1
通过从大型语言模型推演中进行离线强化学习实现具备专业知识的智能体
基于大型语言模型的知识型代理系统能够通过想象中的轨迹从环境交互数据中提取知识并与强化学习进行无缝集成。
PDF
3 months ago
Prev
Next