Jun, 2024

对齐不准确响应的 LLMs 的少样本个性化

TL;DR本研究提出了一种新方法,通过使用大型语言模型(LLMs)的误配响应来进行少量示范个性化,其关键思想是通过改进个性化提示来逐步改善每个用户的提示,特别关注 LLMs 的误配响应的上下文,以及为测试查询和个性化提示开发有效的推理方法。实验结果表明,相比于最佳基准线,Fermi 在各种基准测试中显著提高了性能。