- PSLM: 并行生成用于低延迟口语对话系统的文本和语音的 LLM
多模式语言模型通过扩展输入和输出序列,支持并行生成文本和语音,从而改善响应生成的延迟,并保持响应内容的质量。在口语问答任务上的实验证明,该方法进一步通过生成多个语音序列来减少延迟。
- 半自主关注听力系统评估与接管提示
我们提出了一个半自主系统,其中远程操作员可以实时控制自主的聆听系统,实现对低兴趣和参与度的自动检测,并提供明确的接管提示。与自主系统相比,半自主系统普遍被认为更积极,结果表明,识别用户失去兴趣的对话点可能有助于改进完全自主的对话系统。
- 分析用户行为以客观评估口语对话系统
间接但客观地评估系统基于用户行为的框架在社交对话任务中揭示了用户行为与主观评估分数之间的关系,并提出了选择适当的用户行为以为每个社交对话任务进行客观评估提供有价值的观察。
- 对话助手中对话修复的分析
通过分析与 Google 助手和 Siri 的互动,本研究探讨了对话修复中互动语言在虚拟助手和用户之间的重要性,并发现虚拟助手在生成策略方面存在差异,但不能复制人类的修复策略。用户接受度调查显示英语和西班牙语用户在修复策略偏好和虚拟助手使用 - 系统触发的闲聊和任务导向对话之间的统一对话模型
本文研究了即使在一个对话中从聊天转向任务或从任务转向聊天,也会出现的潜在 “主动” 问题,并提出了两种有效的提示模型,以在统一的对话模型中主动生成过渡句子触发系统主导的转换。
- 一种基于 Transformer 的 DuerOS 主动交互机制用户满意度预测
通过 proactive interaction mechanism 预测并提升用户满意度,本文提出了在 DuerOS 中使用基于 transformer 的模型进行大规模的用户满意度预测,能够有效提高用户体验。
- 口语对话系统中的交互主义
本文探讨基于互动主义模型的口语对话系统中的对话建模设计原则。
- 预测口语对话代理的启动点
本文的研究目的是为了提高口头对话系统的自然度,通过一些预训练模型和特征,预测对话系统主动发起回合的时间点,并在 Switchboard Corpus 上实现了更好的性能表现。
- 理解人们如何评价他们的对话
该研究旨在探讨用户评分在口语对话系统中的作用,特别关注用户的人格特质如宜人性和外向性对于交互评分的影响,并设计和验证了一个虚构故事,以此来调查和诱发这些人格特质。结果表明宜人性与交互评分有着显著的相关性,而选择听故事的用户相对来说更可能提供 - 实境游戏学习的自然语言理解:初步评估
研究了一个新的多任务 NLU 结构在小型领域游戏数据集上进行意图识别的表现,发现相比基线方法,Dual Intent and Entity Transformer (DIET) 架构在野外数据上具有较强的鲁棒性。
- 使用释义生成和实体提取的数据增强方法以用于多模态对话系统
研究了应用数据增强和改进 NLU 模型对于在基于游戏学习场景中帮助儿童学习数学基本概念的多模式对话系统的有效性,得到了使用小型数据集进行 MITL 策略下的改写的良好表现。
- ACLEVI: 多语种知识驱动的招生、验证和识别口语对话任务与数据集
该研究介绍了基于知识的认证在语音对话系统中的重要性以及如何利用多语言数据集 EVI 开发和评估多语言信息的三个认证任务,同时利用该数据集提出了一些模型和研究方向。
- 利用对比学习进行带门限的多模态融合,以预测人机对话中的轮流发言
本研究采集了一组大规模的多模式对话语料库,并设计了一种新的门控多模式融合机制来利用各种信息进行转换预测。为了解决数据不平衡问题,我们设计了一种简单且有效的数据增强方法,通过对比学习得到更好的特征表示。实验证明,我们的模型在多个方面表现优异, - ACL半监督交互式意图标注
展示了一个基于 BERT 模型的 Intent Bulk Labeling 系统,通过使用先进的聚类和可视化标注方法,与数据增强技术相结合,提高了 SDS 模型的意图和分类准确度达到超过 10% 的效果。同时,该系统还可从聚类模型提取话语嵌 - E2E NLG Challenge 发现
本文介绍了第一个共享的自然语言生成(NLG)的端到端(E2E)口语对话系统实验结果。E2E NLG 共享任务旨在评估这些新方法是否能够通过从高词汇丰富度,句法复杂度和多样化的话语现象的数据集中学习来生成更高质量的输出。
- COLING对话系统中基于变分神经语言生成的对抗领域自适应
本研究提出了一种通过对抗训练方法训练基于变分编码器 - 解码器的语言生成器来实现域适应的方法,通过该方法,可以仅使用少量的领域内数据就能够有效地利用源领域中现有的知识来适应其他相关领域。
- ACL基于任务导向和非任务导向的口语对话系统结合的智能助理对话检测
研究智能助手是否可以匹配用户的聊天意图,构建了新的数据集以及使用推特和 Web 搜索查询来处理无特定领域的用户发言,实验结果表明,使用 tweets 和 Web 搜索查询可以进一步提高智能助手的 F1 分数。
- 高斯过程强化学习实现的对话管理领域适应性
本文探讨了使用高斯过程强化学习扩展多个对话领域的方法,这是一种优雅的框架,自然支持多个方法,包括先前的知识,贝叶斯委员会机器和多智能体学习,用于促进可扩展和适应性对话系统。
- ACL基于强化学习的不确定性下自然语言生成规划
本研究提出了一种新的基于统计规划的自然语言生成模型,它能够在存在噪声反馈的情况下(例如用户和实现器的当前生成上下文),有效地解决常见的自然语言生成问题,包括信息展示、语句长度和信息传递量等方面的折衷问题。我们采用强化学习方法训练该模型,并将 - ACL神经信念跟踪器:基于数据的对话状态跟踪
提出了一种利用预训练词向量进行表示学习的神经信念追踪(Neural Belief Tracking,NBT)框架,用于估计对话中用户的目标,并可以在不使用手工制作语义词典的情况下达到与最先进的模型相同或更好的效果。