Apr, 2024

在线个性化白盒LLMs生成与神经贝叶斯

TL;DR本研究提出一种创新的在线方法,利用神经决策算法来动态优化基于用户反馈的软指令嵌入,提升白盒LLMs的开放式文本生成个性化。通过在各种任务上的严格实验证明,与基线策略相比,尤其是NeuralTS,在个性化新闻标题生成方面取得了显著的性能改进,最佳ROUGE分数提高了62.9%,在LLM-agent评估方面提高了2.76%。