QBERT: 用于处理问题的通用模型

Dec, 2022

QBERT: Generalist Model for Processing Questions

Zhaozhen Xu, Nello Cristianini

TL;DR本文介绍了一种可用于处理问题的通用模型 QBERT，并采用它进行多任务学习，证明了其在各项任务上均有相似的表现。

Abstract

Using a single model across various tasks is beneficial for training and applying deep neural sequence models. We address the problem of developing generalist representations of text that can be used to perform a

deep neural sequence models generalist representations short question processing multi-task network qbert

发现论文，激发创造

基于 Transformer 的语言模型在抽取式问答中的比较研究

本文旨在研究和比较不同的预训练语言模型在回答问题的能力上的表现，通过使用 Bert-BiLSTM 结构模型的效果来检验双向流的加入是否能够提高模型性能，并发现 RoBERTa 和 BART 表现最佳。

Oct, 2021

利用 Transformer 语言模型简化段落级问题生成

Question generation is a natural language generation task that can be achieved with a single Transformer-based unidirectional language model, which outperforms QG baselines and produces high-quality questions that are relevant to their context paragraph and easy to answer, utilizing transfer learning without relying on auxiliary data.

May, 2020

从自然出现的商业对话中提取相似问题

我们使用经过适当调整的表示方法和少量示例来对商业用户感兴趣的问题进行分组，并制作可用于数据探索或员工培训的可视化。

Jun, 2022

超越 I.I.D.: 基于知识库的问答的三个泛化层次

本文研究在知识库问答（KBQA）中，为了增强模型的泛化能力，建议模型应具有三个内置泛化层面：i.i.d、组合和零样本，并提出一种新颖的基于 BERT 的 KBQA 模型，此外构建和发布一个高质量的数据集 GrailQA，为三个泛化层面提供评估设置。实验证明，预训练的上下文嵌入（如 BERT）在 KBQA 的泛化中起着重要的作用。

Nov, 2020

预训练变压器在知识图谱上进行简单问答

本研究通过对知识图谱建立的基于神经网络（包括 BERT 和 BiLSTM）的简单问题回答模型进行评估，探究在数据稀疏的情况下 BERT 模型的表现。

Jan, 2020

自然语言处理方法在问题难度估计中的定量研究

本研究通过定量分析之前研究中提出的几种方法，比较它们在三个不同教育领域包含不同类型问题的公开真实数据集上的表现，发现基于 Transformer 的模型在跨不同教育领域的 MCQs、科学题和数学题等方面表现最佳，超越其他方法甚至在较小的数据集上也表现得更好。

May, 2023

使用子图嵌入的问答

本文介绍了一种使用少量手工制作特征便可回答广泛话题的问题，通过学习单词和知识库组成的低维嵌入来评估自然语言问题的候选答案的系统。通过使用问题和其答案的结构化表示以及问题改写对模型进行训练，在文献竞赛基准测试上获得了竞争性的结果。

Jun, 2014

段落级问题生成的生成式语言模型

通过引入 QG-Bench，这是一个多语种，多域基准，对现有的问答数据集进行转换，提出了鲁棒的 QG 基准和基于精细调整的生成语言模型，并对其进行了有效性和适应性分析。

Oct, 2022

MultiQA：阅读理解中泛化和迁移的实证研究

本文研究阅读理解（RC）数据集之间的通用性和现有数据集对提高新数据集表现的贡献，使用 Bert 等上下文表示方法，证明在一个或多个数据集上训练，并在目标数据集上进行转移学习可以显著提高 RC 表现，同时发现在多个来源 RC 数据集上训练可以降低新 RC 数据集的示例收集成本，并提出了基于 MultiQA 的模型，取得了五个 RC 数据集的最先进的表现。

May, 2019

问答数据集让模型学到了什么？

本文通过评估五个数据集上的基于 BERT 的模型来研究模型是否从问答数据集中学习阅读理解，发现没有一个数据集能够具备全部实验的鲁棒性，并且发现了数据集和评估方法的不足，最后建议构建更好的 QA 数据集以评估阅读理解任务的问答能力。

Apr, 2020