Feb, 2024

PANDA:增强LLMs的领域特定能力的优先适应

TL;DR利用无需微调的Preference Adaptation方法增强LLMs的领域专属能力,提高文本分类和交互决策任务的性能,并显示调优自由方法具有从弱到强泛化的潜力。