Jun, 2024

优化和测试指令追踪:分析对指令化调整的语言模型的细粒度指令变种的影响

TL;DR介绍了一种有效的数据增强技术,通过将复杂指令分解为简单的子组件、修改并重构它们为新的变体,以在训练和评估大型语言模型的指令追踪精度时保留原始指令的上下文和复杂性,并引入可变性。使用该方法开发了 DeMoRecon 数据集来精细调整和评估大型语言模型,在我们的指令追踪基准和常用基准上,发现使用 DeMoRecon 进行精细调整的大型语言模型性能显著提升。