关键词transformer-based prlm
搜索结果 - 2
- 基于通道感知的多轮对话理解解耦网络
本文提出了一种组合学习方法,进一步超越了预先训练的语言模型,以捕捉涉及对话历史的话语感知和说话人感知等表示。通过使用 Transformer-based PrLM 的 masking 机制,将每个单词分别聚焦在当前话语,其他话语和两种说话人 - AAAI针对多轮对话的话语感知和说话人感知表示填充
本文提出了一种新型方法,旨在通过建模对话历史中蕴含的有效话语意识和发言人意识表示,从而解决现有基于检索的多轮对话建模中针对言语和说话人角色的细粒度表示不足的问题,并在四个公共基准数据集上显著提高了 ELECTRA 基线的性能,达到了多种新的