Dec, 2023

对齐中良好数据的特点研究:自动数据选择在指令调优中的综合研究

TL;DR深入研究自动数据选择策略以提高模型对齐,介绍了对数据进行测量的现有方法和新技术,提出了基于测量的简单数据样本选择策略,并通过使用该策略自动选择的数据样本,从 LLaMA 和 Mistral 模型微调了一系列模型(deita),结果显示,deita 使用的训练数据样本只有基准测试中使用数据的十分之一,性能优越。预期此研究将为自动数据选择提供工具,促进数据效率对齐。