控制 Web 问答的风险
通过重新设计现有的机器阅读理解数据集,将其转化为互动、部分可观察的环境,加入上下文命令并训练模型,有望将模型扩展到面向 Web 级别的 QA 场景。
Aug, 2019
本文提出了一种名为 RMRC 的方法,使用对话和领域自适应技术构建问题 - 答案对,通过答案提取器和问题选择器以及增强式自训练方法进行优化,从而解决机器阅读理解中因领域迁移引起的问题,包括噪声对应和效率降低,实验证明了该方法的有效性。
Sep, 2022
提出了一种两阶段知识蒸馏方法,通过将 MRC 任务分为两个单独阶段教导模型更好地理解文档,实验结果表明,使用该方法装备的学生模型具有显著的改进,证明了该方法的有效性。
Jul, 2023
本研究对最近在多项选择题回答(MCQA)数据集中取得高分的模型进行扰动实验,发现其表现不符合语言理解的人类期望,提出了一种新的训练方法,使模型更好地学习输入数据并使模型性能更好。
Nov, 2020
本研究提出一种深度串级学习模型来平衡在线问答系统的效能和效率之间的基本权衡,在多文档的 MRC 场景中取得更好的效果并能够在不到 50 毫秒内稳定地为数百万日请求提供服务。
Nov, 2018
通过评估模型的能力,并在此基础上基于模型状态提供适当的训练数据,我们设计了一个可解释和多维度的 MRC 模型能力评估框架,并开发了 CBBC 策略,实现了基于模型能力的训练,从而最大化数据价值和提高训练效率。实验表明,我们的方法显著提高了 MRC 任务的性能,$EM/F_1$ 最高可达到 11.22%/8.71%。
Mar, 2022
本文提出在 fine-tuning 阶段加入两个辅助任务,建立跨语言问题 - 段落对,并结合从 web 挖掘的知识短语进行跨语言 MRC,实验证明该方法有效。
Apr, 2020
本文旨在探索更好的验证模块设计以解决包含难以回答的问题的机器阅读理解任务。我们提出了一个后验阅读器(Retro-Reader),通过将两个阅读和验证策略整合到一起进行机器阅读和理解,旨在模仿人类解决阅读理解问题的过程,并在两个基准 MRC 数据集 SQuAD2.0 和 NewsQA 上取得了最新的最优结果。经过显著性测试,我们的模型明显优于强大的 ELECTRA 和 ALBERT 基线,同时还进行了一系列分析来解释所提出的阅读器的有效性。
Jan, 2020
提出了一种风险感知的对话式搜索代理模型,平衡了回答用户查询和提出澄清问题的风险,并通过强化学习策略在 MSDialog 数据集上得到了比非风险感知基线更好的结果。
Jan, 2021