Feb, 2025
基于多样性驱动的数据选择用于语言模型调优的稀疏自编码器
Diversity-driven Data Selection for Language Model Tuning through Sparse
Autoencoder
TL;DR本研究针对当前预训练大型语言模型在与人类偏好对齐时面临的数据选择问题,提出了一种关注数据多样性的数据选择策略。通过使用稀疏自编码器来衡量数据多样性,本研究不仅提供了更好的模型可解释性,还实验证明了在精选数据上训练的模型在能力上超越其他方法,降低了训练成本,并可能更好地控制模型行为。