Aug, 2024

DELIA:多样性增强学习用于大型语言模型的指令适应

TL;DR本研究针对大型语言模型(LLMs)在指令调整中存在的模型特征偏倚问题,提出了一种新颖的数据合成方法DELIA,以提高模型适应性的潜力。DELIA通过优化指令调整中的偏倚特征,将其转化为理想特征的近似,从而在多项测试中获得了显著性能提升,表明其在促进数据驱动的学习方面具有重要影响。