构建基于知识的开放领域对话生成技术旨在利用挖掘的知识与人类进行闲聊。本文提出了一个高质量的多源对话知识选择和生成评估基准,名为 multi-source Wizard of Wikipedia(Ms.WoW),用于评估多源对话知识选择和生成。与现有数据集不同的是,它包含了清晰的支持知识,以话语为单位分成多个知识来源。我们进一步提出了一个新挑战,即对话知识即插即用,旨在以零 - shot 的方式测试已经训练好的对话模型在使用未见过的新知识来源时的能力。
Mar, 2024
本研究提出了一种将对话模型中的背景知识文档自动转换为文档语义图以对其进行知识选择,并联合应用多任务学习来改善句级和概念级知识选择的方法,并通过实验证明其在诸如 HollE 和 WoW 等领域的知识选择任务和端对端响应生成任务上均优于基于句子选择的基线模型,并且在看不见的话题上改进了泛化能力。
Jun, 2022
该研究使用 MutliWOZ-based 数据集,演示了当前方法在去除信息源严格假设时表现显著下降,并且利用预先训练的语言模型 fine-tune 了一个基于 BART 的模型,可以融合结构化和非结构化知识生成响应。
Oct, 2022
通过从 Wikipedia 中检索知识来生成自然回复,我们的最佳对话模型在 Open-Domain 话题上进行了知识交流,同时我们的新基准允许在这一重要研究方向上进行进一步的改进。
Nov, 2018
本文提出了一种基于动态多种知识融合的开放域聊天机器人模型,其中结构化的三元组来自知识图谱,非结构化的文本来自文档,并采用动态虚拟知识选择器和控制器以及新颖的动态知识内存模块来扩展知识空间,实验结果表明了方法的有效性。
Apr, 2022
本文提出一种基于语义知识排名模型和知识融合模型的开放领域问答方法,该方法通过整合基于 Lucene 的信息检索系统检索的知识和 BERT 语言模型中的外部检索知识,以正确回答问题。研究表明,基于知识融合模型的方法优于之前的尝试。
Apr, 2020
本研究旨在探索使用 Wikipedia 的文本信息和添加更多的训练数据来解决在科学等学科领域中的多项选择题答题任务,实验表明,我们的方法在准确性上相较于先前的最先进技术获得了显著的提升。
Feb, 2019
本研究针对限定领域 API 的局限性,采用一种基于查询 - 选择 - 回应的方法,引入了外部非结构化知识资源,通过对话上下文信息的提取和增强实现了对超出 API 覆盖范围用户请求的响应,并在 DSTC9 Track 1 基准数据集上实现了全自动和人工评估的最优性能,验证了我们的贡献的有效性。
Jun, 2021
通过引入多层级的知识检索器 MAKER 及一种新的蒸馏目标和监督信号,对话系统中的知识检索与响应生成解耦,从而有效地检索大规模的知识库。
May, 2023
本文介绍了一个基于人人写作而成的多领域伪随机项目 (MultiWOZ),是目前已有数据集中体积最大的任务导向型对话集,其意义在于为未来研究设定了基线,并揭示了其与对话信念状态、对话行为等方面的相关性
Sep, 2018