大规模答题者用于视觉对话问题生成
本文提出了一个任务,即 Complex Sequential QA,它结合了回答简单事实性问题和通过一系列有逻辑的问答匹配进行会话来进行复杂推理,本文也介绍了关于这个任务所需数据集,以及目前现有的模型在处理实际场景中还存在的不足。
Jan, 2018
本研究提出了一种新的信息理论策略: 基于该策略的 AQM 模型能有效地处理面向目标的对话任务, 尤其是在问答者句子序列学习方面的复杂性,与其他相比,经验证明AQm更胜一筹。
Feb, 2018
展示了一个简单对称的辨别性基线,该基线可用于预测答案和问题,其性能与最先进的记忆网络方法相当。此外,首次在视觉对话数据集上评估了提问系统的性能,并展示了如何从辨别式问题生成和问题回答生成视觉对话。
Mar, 2018
提出了一种新的评估基准用于评估现有的自动生成问题系统的性能,特别是长文本答案下的自动生成问题系统。研究表明,随着答案长度的增加,现有 AQG 方法的性能显著下降,变压器模型在长答案方面的表现优于其他 AQG 方法,但仍存在性能下降的情况,这表明长答案 QA 是未来研究的具有挑战性的基准任务。
Apr, 2020
本文提出一种联合框架,用于改善多轮对话中回复生成的表现。这种框架结合了阅读理解任务和回复生成任务,共享相同的编码器来提取共同且与任务无关的特征和不同的解码器来学习任务特定的特征。用记忆更新器增强Transformer体系结构以更好地将问题和对话历史的信息融合在编码部分,并在大规模对话阅读理解数据集上进行了实验,结果显示该模型对于两个任务都带来了显著的改进。
Dec, 2020
在 Q-Bot-A-Bot 图像猜测游戏设置下,利用强化学习与监督学习等方式构建一个关于视觉对话问题的相关实体增强问答系统 (ReeQ) 和基于增强学习的可靠游戏者 (AugG),这一方案在 VisDial v1.0 数据集上达到了最佳表现,能够提供更多视觉相关、丰富和连贯的问题。
Sep, 2021
SG-CQG是一个用于回答无答案设置下如何生成与要求自然的对话的方法,它通过语义图和具有明确控制信号的分类器来解决what-to-ask和how-to-ask的挑战。同时,提出了新的评估指标Conv-Distinct,并在实验中取得了最先进的表现。
May, 2023
为应对可扩展且智能的问答挑战,我们引入了一种创新解决方案,利用开源的大型语言模型(LLMs)来确保数据隐私。我们在一个入门计算机科学课程的 Piazza 数据集上进行了实验,并对一个小的子集进行了人工评估和自动 LLM 评估。我们初步发现通过多种建模技术能够将答案的质量提升33%,而 RAG 是一个有影响力的改进。这项工作为开发适用于在线问答平台的智能 QA 助手 ChaTA 打下了基础。
Nov, 2023
为了解决Conversational question answering (ConvQA)中的数据稀缺问题,我们提出了一种名为Dialogizer的新型框架,能够从文本源自动生成具有高上下文相关性的ConvQA数据集。框架中结合了两种训练任务:question-answer matching (QAM)和topic-aware dialog generation (TDG)。在推理阶段,基于生成的问题的上下文相关性进行重排。通过使用多个领域的文档作为主要来源,使用我们的框架,我们生成了四个ConvQA数据集。通过多样化指标的自动评估以及人工评估,我们验证了我们提出的框架相较于基线对话修复模型具有更高质量的数据集生成能力。
Nov, 2023
评估了没有在此任务上进行明确预训练的大型语言模型的性能,并通过一系列实验在广泛的基准数据集上比较了具有不同提示技术和不同大小的模型,并确定了生成输出中的常见问题类型。结果表明,大型语言模型能够从对话中生成图查询,并通过少样本提示和微调技术实现显著提升,特别是对于展现较低零样本性能的较小模型。
Jan, 2024