Jun, 2024

按学生偏好调整教师生成定制训练数据

TL;DRARTE 提出了一种与学生偏好进行对齐的框架,通过采集学生对教师模型的问题和原理的偏好,并将教师模型与学生偏好对齐,生成定制化的训练样例。该框架在实验中表现优越,并对学生和教师模型的泛化性进行了全面研究。