Jun, 2024

使用 HED-IT 进行精调:人工后期编辑对对话式语言模型的影响

TL;DR本研究通过调查人类干预对机器生成数据进行微调对话模型的影响,证明了人类后编辑对话相较于自动生成的对话在感知质量上具有显著提高,并且使用后编辑对话进行微调会导致生成输出有明显差异。此外,该研究认为数据质量对较小的模型影响重大,而对较大的模型影响较小,这些发现有助于我们理解人类干预对高质量语言模型训练数据的影响。