Apr, 2024
通过想象力、搜索和批评实现 LLM 的自我提升
Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing
Ye Tian, Baolin Peng, Linfeng Song, Lifeng Jin, Dian Yu...
TL;DRAlphaLLM 通过将 Monte Carlo Tree Search (MCTS) 与 LLMs 集成,建立了一个自我改进循环,从而提高了 LLMs 的能力,同时避免了其他额外的注释,实验结果表明 AlphaLLM 显著提高了 LLMs 的性能。