预训练语言模型中的对话响应动态

Oct, 2022

预训练语言模型中的对话响应动态

"No, they did not": Dialogue response dynamics in pre-trained language models

Sanghee J. Kim, Lang Yu, Allyson Ettinger

TL;DR本文研究了预先训练的语言模型中对话响应敏感性的程度，并通过一系列实验重点研究了涉及关注内容和省略现象的动态的敏感性。研究结果表明，模型对于嵌入子句的独特作用和前置话语中主要内容的响应具有明显的敏感性，但在涉及是否关注内容的全范围动态捕捉方面存在混合和普遍弱的趋势。此外，模型在掌握省略所涉及的动态方面存在根本性限制，并且响应选择明显受到表面因素的干扰，这些因素超过了原则上的话语限制的影响。

Abstract

A critical component of competence in language is being able to identify relevant components of an utterance and reply appropriately. In this paper we examine the extent of such dialogue response sensitivity in pre-trai

发现论文，激发创造

一种语用学的增量迭代响应模型

本文介绍基于迭代响应的语用学模型，其中语言使用被概括为一种递归过程，通过递增的方法推理、生成、理解信息。与以往的完整语句版本不同，文章提出了一个增量的语用学模型，通过计算模拟和实验数据表明该模型能够有效地生成指代表达，从而实现了语用推理的实时递增。

Sep, 2018

面向任务的对话系统中神经响应选择的训练

通过在大型通用领域对话语料库上预训练反应选择模型，然后利用小型特定领域数据微调预先训练的模型，本论文提出了一种有效的方法来部署任务导向对话中的响应选择，取得了很好的效果。在六个不同的应用领域，从电子商务到银行业，本方法都表现出了良好的效果。

Jun, 2019

基于共识的对话游戏：强调视觉对话环境中的交流基础

本文介绍了一种通过协议达成共识的对话设置，除任务级别目标外，还有一个次要的、显式的目的——达成对任务级别目标是否达成的共识——使得会话参与者更关心彼此的理解，从而产生更丰富的数据以推导模型。

Aug, 2019

理解间接回答

本文关注了对话中的一种实用推断问题：理解对问题的间接回答。通过精心的众包，创建并发布了第一个大规模的英语语料库'Circa'，并提出了基于BERT的神经模型来预测一对问题-答案的类别。结果表明，虽然从蕴涵的传递学习中可以得到合理的表现，但性能还不足以进行稳健的对话。我们的模型可以达到4类区分的82-88％的准确性，6类则为74-85％。

Oct, 2020

DialogBERT: 通过学习恢复和排序话语生成具有话语意识的响应

本文提出了 DialogBERT，这是一种新型的对话响应生成模型，通过使用分层Transformer架构和两个训练目标，包括掩码语调回归和分布式语调顺序排名来提高先前基于PLM的对话模型，在三个多轮对话数据集上进行实验证明，相比于BART和DialoGPT，DialogBERT在定量评估方面表现出色，并且在人类评估中证明，DialogBERT比基线模型生成的响应更连贯、信息量更大，并更加接近人类表现。

Dec, 2020

透过话语连接词观察预训练语言模型的实用能力

本论文旨在针对基于预训练语言模型（LMs）的语用能力，重点关注与话语连接词有关的语用能力。我们通过自然发生的数据和来源于心理语言学的控制输入结合的方式来制定填空测试方式，重点测试模型使用语用线索预测话语连接词的能力、理解与连接词相关的含义，以及模型对连接词时间动态的人类偏好程度。我们发现，虽然模型在自然发生数据的情境下可以合理地预测连接词，但当我们控制语境以孤立高级语用线索时，模型的灵敏度较低，而模型也没有显示出显著的人类时间偏好。总体而言，研究结果表明，在现阶段，主流的预训练模型不能够达到具备实质性的语用能力。

Sep, 2021

人类与语言模型的语用语言理解的精细比较

本文通过在英语材料的专家评估集上进行零-shot提示，进行了人类和语言模型在七个语用现象上的精细比较，发现最大的模型可以实现高精度和匹配人类错误模式，同时发现证据表明模型和人类对相似的语言提示敏感，旨在探讨人类语用处理机制和语言模型之间的关系。

Dec, 2022

编剧对话与自发对话中的交谈反馈：比较分析

通过对电影和电视字幕以及自然对话语料进行数量分析，研究发现字幕中的对话反馈明显较少，负面反馈比例较高，而大型语言模型生成的对话响应也呈现相似趋势，除非该模型基于自然对话进行显式微调。

Sep, 2023

对话推理的对比学习

推理，尤其是归纳过程中产生的推理，是我们通过补充发言者隐含或明示传达的信息来进行对话的重要组成部分。然而，尽管最近的大型语言模型在推理任务方面取得了显著进展，但它们在归纳推理（不是所有信息都在上下文中出现）方面的表现远远落后于演绎推理。在本文中，我们通过基于语义信息差异定义的任务难度来分析模型的行为，从而区分归纳和演绎推理（Johnson-Laird，1988年，1993年）。我们的分析揭示了对话背景和所需推理之间信息差异的显著挑战，缓解这种信息差，我们研究了一种对比学习的方法，通过提供负样本进行训练。我们的实验表明，负样本有助于模型理解错误之处并改善推理生成。

Oct, 2023

归因与对齐：对话中局部语境重复对话语产生和理解的影响

调研表明，语言模型在对话生成中重复具有关键作用，并且关联着词汇重用的处理机制，加强这方面的研究有助于开发认知启发式的对话生成系统。

Nov, 2023