Jan, 2022
从沙子中筛选更多的金子:利用有噪声的自我检索生成优化开放域对话训练
Pan More Gold from the Sand: Refining Open-domain Dialogue Training with
Noisy Self-Retrieval Generation
TL;DR通过引入BERTScore提高证据质量,构建retrieval-generation训练框架,利用信息丰富但杂乱无章的对话数据,能使模型生成更好的响应,甚至比扩大培训集带来更好的性能提升。