Apr, 2024

通过从大型语言模型推演中进行离线强化学习实现具备专业知识的智能体

TL;DR基于大型语言模型的知识型代理系统能够通过想象中的轨迹从环境交互数据中提取知识并与强化学习进行无缝集成。