Jan, 2022

从沙子中筛选更多的金子:利用有噪声的自我检索生成优化开放域对话训练

TL;DR通过引入BERTScore提高证据质量,构建retrieval-generation训练框架,利用信息丰富但杂乱无章的对话数据,能使模型生成更好的响应,甚至比扩大培训集带来更好的性能提升。