Nov, 2023

思维的一切:挑战彭罗斯三角形定律的思维生成

TL;DR使用预训练增强学习和蒙特卡罗树搜索,引入了一种称为 “Everything of Thoughts”(XoT)的新思维启发方法,以提升大型语言模型(LLMs)的能力并使其能够高效地推广到未见过的问题。这种方法利用 MCTS-LLM 协作思维修订框架自主产生高质量的综合认知映射,同时赋予 LLMs 进行无约束思考的能力,从而对具有多个解决方案的问题进行灵活的认知映射。