Oct, 2022

预训练语言模型中的对话响应动态

TL;DR本文研究了预先训练的语言模型中对话响应敏感性的程度,并通过一系列实验重点研究了涉及关注内容和省略现象的动态的敏感性。 研究结果表明,模型对于嵌入子句的独特作用和前置话语中主要内容的响应具有明显的敏感性,但在涉及是否关注内容的全范围动态捕捉方面存在混合和普遍弱的趋势。 此外,模型在掌握省略所涉及的动态方面存在根本性限制,并且响应选择明显受到表面因素的干扰,这些因素超过了原则上的话语限制的影响。