Jun, 2024

LangSuitE:在具体文本环境中规划、控制和交互大型语言模型

TL;DR通过介绍一种新的多用途无仿真测试平台 LangSuitE 以及一种新的思维链式 (schema) EmMem 来评估大型语言模型在动态交互环境中作为少样本或零样本具有实体的智能体的效果和挑战,该研究对于建立语言模型背景下的具有实体特征的普适性智能体代表了重要的进展。