Feb, 2024

通過行動學習增強大型語言模型代理

TL;DR我们的研究探索了语言代理程序的开放式行为学习,在每一次迭代中,通过修正和更新当前可用的动作,从而提高动作的有效性,实验证明,这种开放式行为学习方法显著改善了代理程序的性能,突出了经验行为学习在更智能的大型语言模型代理程序发展中的重要性。