- 迈向稳健和多样性:使用文本混合和批量核范数最大化的对话生成中的持续学习
该论文研究了在持续学习环境下的对话生成,并提出了一种新的方法,使用 Text-Mixup 作为数据增强以避免模型在重播记忆上过拟合,同时利用 Batch-Nuclear Norm Maximization(BNNM)来减轻模式坍塌问题。实验 - 对话生成的双层计划抽样
本文提出了一种双层预训练采样模型,结合句子级信息和单词级质量,并利用平滑函数将两者的综合结果映射到适当的范围,基于映射值进行概率采样。在 DailyDialog 和 PersonaChat 数据集上的实验证明了我们提出的方法的有效性,明显缓 - ACL信任随机鹦鹉的危险:面向开放领域对话问答的诚实和信任
本文提出了基于任务的对话系统比基于知识库的系统更受欢迎和值得信赖,论文基于开放领域的问答系统作为测试平台,比较了几种开放式和封闭式模型,着重强调了通过机械的模仿用户输入来提供不忠实回答的系统的危险性
- 翻译是否有帮助?低资源对话生成中跨语言转移的实证分析
本文研究了在跨语言对话生成任务中是否使用机器翻译系统能够提高中文的自然度、相关性和跨领域可传递性,研究表明直接使用英语对话语料比使用翻译版本更好。建议未来的研究应集中于利用英语数据进行跨语言转移。
- AAAI基于关键词导向的对话生成预训练模型
在对话生成领域,我们提出了一种基于关键词引导的自监督预训练方法 (KPT),该方法可以从对话数据中抽取关键词并构建两种不同的知识,以处理基于知识的生成任务,如对话行为,知识图谱和个人描述等。实验结果表明,KPT 在此类任务中具有优异的表现。
- BotSIM:商业任务导向对话系统的端到端对话机器人模拟工具包
BotSIM 是一个模块化、开源的机器人仿真环境,具有对话生成、用户模拟和对话分析功能,旨在成为大规模、数据高效的商业任务导向对话系统评估、诊断和修复的一站式解决方案,以显著加快商业机器人的开发和评估,降低成本和上市时间。
- 通过查询生成实现信息对话生成中的动态知识检索
为了实现对话系统的智能回答,文中设计了 DRKQG,该系统能够根据上下文信息,在没有提前准备知识库的情况下通过搜索引擎检索相关知识,并利用生成模块同时考虑上下文信息和检索知识生成回答,实验结果表明,该模块在自动评估和人工评估两方面取得了优异 - CORAL:用于训练对话生成模型的上下文响应可检索性损失函数
本论文提出了一种新的损失函数 CORAL 来应对交流生成任务的独特挑战,该方法可以直接优化人类喜好生成的响应,从而避免了 CE 损失的局限性,取得了比不同规模的强状态基线模型更好的效果。
- ACL文本生成参考无关评估中的伪相关性
本研究发现参考无关的自然语言生成系统的评估指标(即用于摘要和对话生成的评估指标)可能会依赖于与诸如单词重叠,困惑度和长度等指标的虚假相关性。同时,我们注意到当评估最先进的抽象化摘要系统时,这些指标具有高错误率,但可以通过明确设计避免参考无关 - 多模态对话生成中的文本视觉相互依赖建模
该论文提出了一种解决多模态对话生成的方法,可以更好地模拟真实环境中的多模态对话。通过建模文本 - 视觉特征之间的相互依赖,并研究生成与视觉背景相关的对话,大幅提升了模型性能。
- ACL基於改寫的任務導向對話生成
该研究提出了一种基于替换词增强的响应生成 (PARG) 框架,该框架联合训练了一个替换模型和一个响应生成模型,以提高对话生成的性能,并通过对话状态和对话行为标签自动构建替换培训数据集。实验结果表明,所提出的框架进一步改善了 CamRest6 - ACL通过元学习实现领域自适应对话生成
提出了基于元学习的领域自适应对话生成方法(DAML),该方法基于单域对话数据和元学习算法进行训练,并能够在新领域中学习出一种具有竞争力的对话系统。在模拟对话数据集上评估该方法的表现,实现了最先进的性能,该性能可推广到新任务。