Apr, 2021
将主观众评估作为改进自然语言生成的附加客观标准的估计
Estimating Subjective Crowd-Evaluations as an Additional Objective to
Improve Natural Language Generation
TL;DR本文探讨在多任务学习设置中,使用主观评估作为语言生成模型训练的一部分,并使用群众创作对话语料库对六种不同的语言生成模型进行微调。评估显示,多任务学习的模型生成的话语在主观上评分最高,且在推动对话发展、无冒犯性等方面得分最高。因此,将来可以研究将主观人类评估纳入语言生成模型训练中,从而在开发过程中更好地与人类用户进行交互。