Apr, 2024

通过想象力、搜索和批评实现 LLM 的自我提升

TL;DRAlphaLLM 通过将 Monte Carlo Tree Search (MCTS) 与 LLMs 集成,建立了一个自我改进循环,从而提高了 LLMs 的能力,同时避免了其他额外的注释,实验结果表明 AlphaLLM 显著提高了 LLMs 的性能。