通过整合知识检索和回答生成,本研究提出了一种检索生成器架构,利用检索器获取相关知识并生成系统回应,并通过生成器的反馈建立检索训练标签,通过对三个基准数据集的实验结果证明了方法在任务导向对话任务中的优越性能。
Oct, 2023
利用最大边际似然方法训练感知检索器,通过利用生成回应的信号来提高生成回应的质量,并结合元知识指导生成器,以增强知识的利用能力。
本文介绍了一个多任务学习的神经检索模型,该模型在少样本、领域内外多种问题下表现良好,能够有效地检索到相关上下文信息,并且在多个基准测试中实现了与或优于目前的最新技术结果。
Jan, 2021
我们提出了一种创新的端到端生成框架,用于多模态知识检索,通过利用大型语言模型 (LLMs) 作为虚拟知识库,使用对象感知的前缀调优技术来指导多粒度视觉学习,将多粒度视觉特征对齐到 LLM 的文本特征空间中,通过统一格式的指令数据构建模型训练,最后,我们提出了知识引导的生成策略,在解码步骤中施加先验约束,促进独特知识线索的生成,在三个基准测试中实验证明,与强基线方法相比,在所有评估指标上均取得了 3.0% 到 14.6% 的显著改进。
Jan, 2024
提出了一种针对获取增强型开放领域问答系统的端到端可区分训练方法,它结合多个已检索文件的信息来生成答案,通过期望最大化算法的近似计算来建模检索决策,证明了该方法优于现有同类方法,达到了新的最高水平。
Jun, 2021
本文总结了我们在第九届对话系统技术挑战赛(DSTC 9)第一轨中的工作,我们提出了一种基于层次分类和序列嵌入的检索和生成方法,以实现针对任务导向对话中利用非结构化文本信息的回答生成。
Feb, 2021
本文提出了一种新的框架,通过两个步骤查询知识库以提高生成的实体的一致性,第一步是使用 KB 检索组件检索最相关的 KB 行,以过滤 Seq2Seq 响应生成模型中的无关实体,第二步则进一步执行关注机制以解决相关的 KB 列。两种方法被提出来使训练可行,包括远程监控和 Gumbel-Softmax 技术。在两个公共数据集上进行的实验表明,我们的模型通过优于基准系统,在生成一致实体响应方面具有较好的效果。
Sep, 2019
论文利用基于余弦相似度的滤波技术以及辅助损失函数构建了一个新的关于任务导向型对话系统和知识库之间的信息筛选模型,并提出了一个解决现有实体 F1 指标正确性问题的新指标 multiset entity F1。实验结果表明该模型比现有的最先进模型表现更好。
Sep, 2021
提出一种基于检索的方法,以加强 TOD 系统中的知识选择,并结合半监督学习进行潜变量模型,该模型可以与知识检索器一起利用有标签和无标签的对话数据。实验证明,该方法在有标签和半监督设置下均优于传统的数据库查询方法。
May, 2023
本文提出了一种受到知识蒸馏启发的学习信息检索器的技术,在没有标注的查询和文档对的情况下,利用阅读器模型的注意力分数来获得检索器的合成标签,用于下游任务,最终在问题回答方面达到了最先进的结果。
Dec, 2020