该研究提出了一种使用注意力机制直接从文本中选取答案的模型,特别适用于以文本中某个单词为答案的问题,并在多个数据集上取得了新的最优成绩。
Mar, 2016
在 SQuAD 数据集上,我们提出了一种多角度上下文匹配模型,它是一种端到端系统,可以直接预测文本段落中答案的起点和终点。我们的模型通过使用双向 LSTM 来编码问题和加权段落,利用多个角度将文本上下文与编码问题进行匹配,并生成一个匹配向量,最终利用另一个双向 LSTM 汇总所有信息并预测起点和终点。在 SQuAD 测试集上,实验结果显示我们的模型达到了领先位置的竞争力。
Dec, 2016
该论文介绍了一个针对较小数据集的任务感知专家网络混合模型,重点研究常识学习问题,并通过训练不同的专家网络来捕获每个段落、问题和选项三元组之间不同类型的关系,同时灵感来自多任务和迁移学习的最新进展。通过将多个网络融合,强制实现它们的特定目标和关系,作者达到了最先进的结果并减少了过拟合。
Oct, 2022
本文探讨了客户服务代理与客户之间多视角摘要的创建方式,通过探索不同视角的启发式算法,创建了弱标注数据并在少量标注数据 fine-tuning 的情况下,支持生成摘要的模型在性能上接近原始数据的 94%,这一方法可以为摘要的人工创建工作减轻负担。
Mar, 2022
该研究提出了一项新的任务,以鼓励模型跨多个文档进行文本理解并探究现有方法的限制。 该任务要求模型学习查找和组合证据,从而实现多跳(别名为多步)推理,但两个先前的竞争性模型都在选择相关信息方面遇到了困难。
Oct, 2017
该研究提出了一种新算法,用于解决复杂的教材题目答案(TQA)任务,该算法主要围绕多模态上下文中的知识特征提取以及自我监督开放式学习过程展开,并且实验证明其优于目前先进的方法。
Nov, 2018
本研究提出了一种模块化的方法,用于在多文档环境中生成包含目标信息的连贯文本,为进一步探索模块化文本生成提供了基础,提高了生成内容的质量和可靠性。
Mar, 2024
本研究提出了一种新的主动学习模型,利用多视图主动学习、Parzen-Rosenblatt 窗口方法和基于预测器的委员会策略等,用于检测自然灾害的正向报道,并在四个不同应用的 Twitter 数据集上通过实验验证该模型的高一致性和优越性。
Dec, 2021
该论文提出了一种新颖的双向神经序列转换模型,能够同时学习阅读理解中的三种知识输入方式,即问题、答案和上下文,并通过分层注意力过程对不同形态之间的交互信息进行捕捉和建模。该模型在四个公开数据集上的表现优于其他同类神经网络模型,尤其在问题回答和生成双方面具有更广泛的应用前景。
Sep, 2018
本文提出了一种共识注意力神经网络架构,并通过中文阅读理解任务实验,表明该网络架构在解决 Cloze-style 问题上优于现有的其他模型,同时也建立了一个中文阅读理解任务的基准,这将有助于未来的相关研究。
Jul, 2016