控制 Web 问答的风险

SIGIRMay, 2019

Controlling Risk of Web Question Answering

Lixin Su, Jiafeng Guo, Yixing Fan, Yanyan Lan, Xueqi Cheng

TL;DR该研究探讨了 Web QA 的风险问题，提出了一种基于预测不确定性的风险控制框架，并引入了风险相关的度量标准进行 Web QA 的评估。实证结果证明了该方法的有效性。

Abstract

web question answering (QA) has become an indispensable component in modern search systems, which can significantly improve users' search experience by providing a direct answer to users' information need. This could be achieved by applying →

web question answering machine reading comprehension predictive uncertainty risk control framework web qa

发现论文，激发创造

带信息搜索代理的交互式机器阅读理解

通过重新设计现有的机器阅读理解数据集，将其转化为互动、部分可观察的环境，加入上下文命令并训练模型，有望将模型扩展到面向 Web 级别的 QA 场景。

Aug, 2019

机器阅读理解的稳健领域自适应

本文提出了一种名为 RMRC 的方法，使用对话和领域自适应技术构建问题 - 答案对，通过答案提取器和问题选择器以及增强式自训练方法进行优化，从而解决机器阅读理解中因领域迁移引起的问题，包括噪声对应和效率降低，实验证明了该方法的有效性。

Sep, 2022

机器阅读理解中的答案修正

研究机器阅读理解中回答验证的有效性，提出了一种后处理修正方法，通过单语和多语评估，在现有 MRC 系统的基础上实现了显著的性能提升。

Nov, 2020

教模型在理解文档后回答问题

提出了一种两阶段知识蒸馏方法，通过将 MRC 任务分为两个单独阶段教导模型更好地理解文档，实验结果表明，使用该方法装备的学生模型具有显著的改进，证明了该方法的有效性。

Jul, 2023

多选题问答系统的期望

本研究对最近在多项选择题回答（MCQA）数据集中取得高分的模型进行扰动实验，发现其表现不符合语言理解的人类期望，提出了一种新的训练方法，使模型更好地学习输入数据并使模型性能更好。

Nov, 2020

多篇文档阅读理解的深度级联模型

本研究提出一种深度串级学习模型来平衡在线问答系统的效能和效率之间的基本权衡，在多文档的 MRC 场景中取得更好的效果并能够在不到 50 毫秒内稳定地为数百万日请求提供服务。

Nov, 2018

通过了解所学来满足所需

通过评估模型的能力，并在此基础上基于模型状态提供适当的训练数据，我们设计了一个可解释和多维度的 MRC 模型能力评估框架，并开发了 CBBC 策略，实现了基于模型能力的训练，从而最大化数据价值和提高训练效率。实验表明，我们的方法显著提高了 MRC 任务的性能，$EM/F_1$ 最高可达到 11.22%/8.71%。

Mar, 2022

提高多语言机器阅读理解答案边界检测能力

本文提出在 fine-tuning 阶段加入两个辅助任务，建立跨语言问题 - 段落对，并结合从 web 挖掘的知识短语进行跨语言 MRC，实验证明该方法有效。

Apr, 2020

机器阅读理解的回顾式阅读器

本文旨在探索更好的验证模块设计以解决包含难以回答的问题的机器阅读理解任务。我们提出了一个后验阅读器（Retro-Reader），通过将两个阅读和验证策略整合到一起进行机器阅读和理解，旨在模仿人类解决阅读理解问题的过程，并在两个基准 MRC 数据集 SQuAD2.0 和 NewsQA 上取得了最新的最优结果。经过显著性测试，我们的模型明显优于强大的 ELECTRA 和 ALBERT 基线，同时还进行了一系列分析来解释所提出的阅读器的有效性。

Jan, 2020

通过强化学习来控制会话式搜索的风险

提出了一种风险感知的对话式搜索代理模型，平衡了回答用户查询和提出澄清问题的风险，并通过强化学习策略在 MSDialog 数据集上得到了比非风险感知基线更好的结果。

Jan, 2021