May, 2024

代理舰队:使用遗传粒子滤波器协同解决问题的大型语言模型

TL;DR利用大型语言模型为代理人的一种新颖框架,动态调整探索策略的同时通过启发式函数优化探索与利用之间的权衡,实验证明其在 “Game of 24” 和 “Mini-Crosswords” 等基准任务上的效率和准确性优于以前提出的 “Tree-of-Thoughts” 方法。