Aug, 2023

Shepherd: 语言模型生成的评论家

TL;DRShepherd 是一个专门针对评论回复和建议改进进行微调的语言模型,通过高质量的反馈数据集从社区反馈和人类注释中提供多样化的错误识别和建议修正,相比于 ChatGPT 等现有模型,Shepherd 具有等效或更优质的评论,通过 GPT-4 的评估,Shepherd 的胜率平均为 53-87%,在人类评估中,Shepherd 的表现明显优于其他模型,平均与 ChatGPT 持平。