May, 2024

弱到强的搜索:通过在小型语言模型上进行搜索来对齐大型语言模型

TL;DR大规模语言模型通过使用弱到强的搜索方法进行调整,以增强模型的效果并提高模型的对齐能力。