关键词stanford question answering dataset
搜索结果 - 9
- 自然分布偏移对问答模型的影响
为了测试问题回答系统的泛化能力,我们建立了四个新的测试集,并发现存在一定适应性过度拟合。此外,我们在自然分布转移方面测试了模型,结果发现人类能力相比 SQuAD 模型有明显优势,同时强调需要采用能够考虑自然分布转移的评估指标。
- ACL通过对抗训练实现强健的机器阅读理解模型
通过提出一个新的对抗生成算法 AddSentDiverse 和改进模型的语义关系学习能力,作者在 Stanford 问题问答数据集上实现了一个近 36.5% 的 F1 得分提升并提高了模型的鲁棒性。
- ICLRFusionNet: 基于全意识关注的融合方法及其在机器理解中的应用
本文介绍了一种名为 FusionNet 的新型神经结构,它通过三个方面的创新来扩展现有的注意力方法。我们将 FusionNet 应用于斯坦福问答数据集(SQuAD)中,并在官方 SQuAD 排行榜上取得了单一模型和集成模型的第一名。同时,我 - DCN+: 针对问答的混合目标和深度残差共同注意力
本文提出一种混合目标函数来优化问答模型,该目标函数将交叉熵损失与自我批判策略学习相结合,并使用词重叠的奖励来解决评价指标与优化目标之间的不匹配。同时,本文还提出一种深度残差共注意力编码器来改善动态共注意力网络,该提案显著提高了模型的性能,在 - EMNLP用于评估阅读理解系统的对抗样本
通过对斯坦福问答数据集(SQuAD)的对抗评估方案,测试阅读理解系统对插入的语义、语法错误的诈骗问题的正确性,从而提高模型对于语言的理解水平。
- IJCAI增强型记忆阅读器用于机器阅读理解
本文介绍了加强版的记忆增强读者,它在多个方面包括提出重新注意力机制和引入动态关键强化学习方法来优化精度,实验表明在 Stanford Question Answering Dataset 上,该模型比先前系统表现更优,实现了最新的技术成果。
- 动态协同网络用于问答
我们提出了动态协同注意网络(DCN)来解决深度学习模型在问题回答中可能会遇到局部极大值的问题,并在 Stanford 问题回答数据集上将准确率从 71.0% F1 提高到 75.9% F1,使用 DCN 合奏能够获得 80.4% F1。
- 使用 Match-LSTM 和答案指针 的机器阅读理解
提出了一个基于匹配式 LSTM 和 Pointer Net 的神经网络结构,用于机器理解文本,能够在 Stanford Question Answering Dataset 数据集上对传统的逻辑回归与手工特征提取方法结果有显著的提升。
- EMNLPSQuAD: 文本机器理解 10 万 + 问题
本研究介绍了 Stanford Question Answering Dataset (SQuAD),一种包含超过 100,000 个问题的阅读理解数据集,旨在研究回答这些问题所需要的类型推理方式,研究使用依赖和组成树建立了强大的逻辑回归模