VANiLLa:大规模自然语言口头回答
本文介绍了一个新的数据集,用于在知识图谱上进行口头回答的对话式问答。该论文通过扩展现有的多轮对话式问答数据集,包括多个释义的口头回答,提供了新的贡献,并使用五个序列到序列模型进行了实验,同时保持语法的正确性。我们还进行了误差分析,详细说明了模型在指定类别中的误差率。我们提议将答案口头化的数据集公开,并详细说明其使用,以便广泛使用。
Aug, 2022
本文提出了一种基于多任务学习的回答转述框架: VOGUE (通过多任务学习的话语化),该框架尝试通过一种混合方法生成话语化的答案,并且在回答转述数据集上表现出 BLEU 和 METEOR 两种分数均优于所有当前基线模型。
Jun, 2021
本研究提出了一种基于句子转换模型的新方法,从庞大数量的大型问答数据集中自动派生自然语言推理(NLI)数据集,并展示了其将多种问答数据集成功应用于自然语言推理数据集的能力,从而新派生出包含 50 万个以上 NLI 示例的免费数据集 (QA-NLI),展示了它呈现的推理现象的宽泛性。
Sep, 2018
本文介绍了使用自然语言处理技术的语义解析器,将用户的自然语言问题转化为有形式定义的查询语句,通过大规模知识图谱实现。作者提供了一个数据集,其中,用户问题采用 Sparql 语言解析,并对执行结果对系统回答进行注释。通过两种不同的语义解析方法,我们提出了挑战:如何处理大规模词汇,如何建模对话语境,如何处理多实体查询语句,并实现对新问题进行泛化。作者希望我们的数据集能够为开发会话式语义解析器提供有效的测试平台。本文的数据集和模型已经发布,详情请见链接。
Jan, 2023
本文介绍了一种基于知识图谱的问答系统,采取了一种新型的深度学习架构和端到端变分学习算法,可以同时处理问题中的噪声和多跳推理,在最新的基准数据集中取得了最优表现。
Sep, 2017
通过创建 IQN-KGQA 测试集,从五个角度对自然度的问题进行了评估并对其进行了改写,以改进自然语言处理中 KGQA 模型的性能并解决构建大规模 KGQA 数据集的挑战。
May, 2022
该论文训练了一个视觉问答系统,使用多种模态的数据来回答关于时尚照片中服装的自然语言问题。他们使用大规模的领域特定的多模态数据集来训练该系统,该数据集使用模板自动生成,模型的最高准确性超过了人类专家水平。
Aug, 2022
本文提出了一种基于 SPARQL 查询的多语言语义 Web 知识库问答(QA)方法,能够查询多个知识库,可轻松移植到其他知识库和语言。通过对五个不同的知识库和五种语言的评估,证明了该方法的影响。
Mar, 2018
本文研究了将知识图谱转化为自然语言文本的任务,主要讨论了广泛的开放领域大规模语言生成的挑战,将知识图谱转化为自然语言文本,从而提高了语言模型的事实准确性和减少了毒性。通过对开放领域 QA 和 LAMA 知识探测的任务进行评估,表明该方法在文本检索方面有很大的优势。
Oct, 2020
本文调查了在深度学习时代发布的有影响力的问答数据集,并介绍了文本问答和视觉问答两个最常见的问答任务,涵盖了最具代表性的数据集,并提出了当前的一些 QA 研究挑战。
Jun, 2022