Feb, 2023

多方对话的通用依赖建模

TL;DR为了模拟多方会话中话语之间的依存关系,我们提出了一个基于依存分析结果的简单通用框架,其中包括一种相对依存编码(ReDE)的方法,并阐述了如何通过修改自注意力的计算方式在 Transformers 中实现它。在四个多方会话基准测试中的实验结果表明,这种框架成功提升了两种基于 Transformer 的语言模型的整体性能,并且与最先进的方法相比具有相当甚至更好的性能。