响应增强的半监督对话查询生成

Dec, 2023

Response Enhanced Semi-Supervised Dialogue Query Generation

Jianheng Huang, Ante Wang, Linfeng Gao, Linfeng Song, Jinsong Su

TL;DR提出了一种半监督学习框架 SemiDQG，通过使用未标注的对话数据来改进模型性能，使用类似度选择策略选取高质量伪查询进一步训练模型，并采用 REINFORCE 算法作为精细化训练信号，实验结果表明该框架在跨领域和资源有限场景中具有显著优势。

Abstract

Leveraging vast and continually updated knowledge from the Internet has been considered an important ability for a dialogue system. Therefore, the dialogue query generation task is proposed for generating search queries from dialogue histories, which will be submitted to a search engin

dialogue query generation search queries semi-supervised learning response-augmented query producer reinforce algorithm

发现论文，激发创造

利用搜索引擎增强的对话响应生成及廉价监督查询生产

通过使用查询产生器从动态信息检索引擎检索知识，为聊天机器人生成响应的对话模型中，基于廉价噪声监督的训练算法用于产生查询，调整查询生成器而无需人为标注黄金查询，取得了不错的检索效果，大大提高了聊天机器人响应的质量。

Feb, 2023

解决半监督问答中的语义漂泊问题

本研究提出了一种基于语义加强的奖励机制和基于 QA 的评估方法，用于解决问题生成中的语义漂移问题，并解决传统评价指标不足的问题，同时提出了两种合成 QA 对的方法，有效的用于半监督 QA 学习中。

Sep, 2019

具有生成领域能力的领域自适应网络的半监督问答

该研究探讨了半监督问答问题，在该问题中，利用无标签文本提高问答模型的性能，我们提出了一种新的训练框架，即生成领域自适应网络。该框架通过训练生成模型来生成基于无标签文本的问题，并将模型生成的问题与人类生成的问题相结合，用于训练问答模型。我们发展了基于强化学习的新领域适应算法，以减少模型生成数据分布与人生成数据分布之间的差异。实验结果表明，我们提出的框架可从无标签文本中获得显著的提高。

Feb, 2017

通过查询生成实现信息对话生成中的动态知识检索

为了实现对话系统的智能回答，文中设计了 DRKQG，该系统能够根据上下文信息，在没有提前准备知识库的情况下通过搜索引擎检索相关知识，并利用生成模块同时考虑上下文信息和检索知识生成回答，实验结果表明，该模块在自动评估和人工评估两方面取得了优异的成绩。

Jul, 2022

q2d：从问题到对话，训练模型学习搜索

该论文介绍了一种自动生成基于搜索查询的对话数据的机器学习方法，通过使用大型语言模型生成问题回答数据集，学习如何与外部搜索 API 通信，以生成具有上下文的搜索查询，从而改善对话系统的回答效果。

Apr, 2023

加强型动态推理在对话问句生成中的应用

本文提出了一个新的任务 —— 对话式问题生成（CQG），研究了如何使用增强动态推理（ReDR）网络来生成针对给定文本和对话历史的问题，使用 QA 模型提供反馈，经过与各种基线和模型变量的比较得出新方法的有效性，并将其应用于 SQuAD 的多轮问答对话中。

Jul, 2019

面向任务的对话中基于非结构化知识的高效检索增强生成

本文总结了我们在第九届对话系统技术挑战赛（DSTC 9）第一轨中的工作，我们提出了一种基于层次分类和序列嵌入的检索和生成方法，以实现针对任务导向对话中利用非结构化文本信息的回答生成。

Feb, 2021

ConvSDG：面向对话式搜索的会话数据生成

基于大型语言模型的 ConvSDG 框架通过生成对话数据来提高对话式搜索的性能，并在四个广泛使用的数据集上展现了其有效性和广泛适用性。

Mar, 2024

AugTriever：可扩展的数据增强无监督密集检索

本文提出了无需注释的可扩展伪查询文档对训练方法，包括查询提取和转化查询生成两种。通过使用这些方法，研究展示出比其他方法更好的检索表现。

Dec, 2022

基于半监督学习的面向知识检索任务的对话系统

提出一种基于检索的方法，以加强 TOD 系统中的知识选择，并结合半监督学习进行潜变量模型，该模型可以与知识检索器一起利用有标签和无标签的对话数据。实验证明，该方法在有标签和半监督设置下均优于传统的数据库查询方法。

May, 2023