ACLMar, 2021

针对任务导向对话的噪声通道模型预训练

TL;DR使用 Bayes' 定理将任务型对话分解为两个模型,上下文给定回复的分布和回复本身的先验,采用嘈杂信道模型的方法既弱化了解释效应,又允许合理地将大型预先训练的模型纳入回复先验中。大量实验证明,相比于直接解码,嘈杂信道模型具有更好的解码性能,并且采用两阶段预训练策略(同时使用开放领域和任务导向对话数据)可以优于随机初始化的模型。