Oct, 2023

更多询问,更深了解:基于大语言模型的增强学习问句在决策制定中的应用

TL;DR利用领导者 - 追随者双层框架,本文实现了一个完全集成的端到端框架,用于处理复杂的推理任务,并通过引入历史发现为生成合适的问题(提示)提供指导,进而指导行动学习。