Jul, 2024

通过强化学习驱动的查询优化增强大规模语言模型的能力和稳健性

TL;DR提出了一种可转移且可插拔的框架,用于改进用户提示,提高大型语言模型的生成能力和鲁棒性,以产生更真实、良性和有用的响应。