- 走向可行的数学推理:解决数学应用题的挑战、策略和机遇
研究了解决自然语言描述的数学问题的非神经和神经方法,并突出了这些方法具有可泛化、数学合理、可解释和可解释的能力,提出使用外部知识和知识渗透学习的需求和机会。
- ACLAdvPicker:通过对抗鉴别器有效利用未标记数据进行跨语言实体识别
本研究提出了一种基于对抗学习的方法(AdvPicker),用于跨语言实体识别,通过对目标语言中与源语言语义相关的数据进行选择,从而改进了神经方法在名词实体识别任务中表现不佳的问题。
- ACLKGPool: 动态知识图谱上下文选择在关系抽取中的应用
本文提出了一种新方法,通过将句子和两个实体映射到知识图谱中的标准事实,从单个句子中提取关系;引入了 KGPool 方法来解决数据稀疏的问题,通过神经方法学习事实的表示来补充句子的上下文,并使用图神经网络演示了该方法的有效性。
- 自然证明:自然语言数学定理证明
NaturalProofs 是一个使用自然数学语言编写数学命题和证明的多域语料库,可用于评估系统在数学参考检索和生成任务中确定证明中出现的关键结果的能力,并提供了许多研究理解和创建自然数学语言的挑战性数学任务的新途径。
- 说话人分离的综述:深度学习的最新进展
本文综述了演讲者分离技术的历史发展,并重点介绍了基于深度学习的新进展,以及演讲者分离系统与语音识别应用之间的相互作用。我们认为,这是一篇有价值的综述工作,为进一步提高演讲者分离效率提供了有力的支持。
- ACLProofWriter: 对自然语言生成蕴含、证明和阿布达布意见的系统
这篇论文展示了一个名为 ProofWriter 的生成模型,能够可靠地生成一个理论的两个蕴含和支持它们的自然语言证明,具有高精度的缺少检测性能,能够大幅提高神经方法用于自然语言推理的可行性。
- 首个神经推测数据集和实验
该文章介绍了使用神经方法创建猜想的数据集和实验,使用转换器架构中的 GPT-2 模型,其中数据集基于多种处理过的 Mizar 数学库和 MPTP 系统提取的问题,并通过 ENIGMA 指南使用 E 证明器证明。
- SLEDGE: 一种简单而有效的 COVID-19 科学知识搜索基线
本文介绍了一个基于 SciBERT 的搜索系统 - SLEDGE,其在 TREC-COVID 挑战赛上表现出强大的效果,并提供了一些潜在的未来方向,包括按日期筛选和更加专注于计数信号的神经方法。
- EMNLP利用扰动自动识别机器翻译中的性别问题
该研究利用神经网络方法实现自然语言翻译,挖掘实际数据中存在性别语言模型与相关问题,发布评估基准用于研究性别语言模型的特性和潜在影响。
- EMNLPMAVEN:一个大规模通用领域事件检测数据集
本研究提出了一种包含 4480 份维基百科文件、118732 次事件提及实例和 168 种事件类型的 MAVEN 数据集,用于缓解数据不足和低覆盖率等问题,实证分析了通用领域事件检测中的进一步研究方向,并表明现有的事件检测方法不能像小规模数 - 零资源跨语言命名实体识别
本文提出一种基于词级对抗训练、参数共享和特征增强的无监督跨语言命名实体识别模型,可在不依靠双语词典或平行数据的情况下,将命名实体知识从一种语言转移到另一种语言。通过对五种不同语言的实验表明,该模型的有效性优于现有模型,并为每个语言对设置了新 - EMNLP被 Echo 的是什么?理解劝说论点中的 “指向
通过对 /r/ChangeMyView 网站上的解释进行分析,提出了一种新颖的单词级预测任务来研究说明如何有选择地重复或模仿所要解释的信息;我们开发了一个捕捉解释内容中单词属性的特征,并且显示了我们建议的特征不仅在解释重复方面具有较强的预测 - EMNLP自动论证质量评估 -- 新数据集和方法
探索自动评估论点质量的任务,通过对 6.3k 个论点进行精细注释,以及 14k 个论点对的高品质论点独立标注,提出基于最近发布的语言模型的神经方法进行论点排序和论点对分类,产生与最先进技术相媲美的结果。
- EMNLP基于规划的分层变分模型进行长篇多样化文本生成
本文提出了一种基于规划的分层变分模型,通过规划出一系列任务子集来分割长文本生成任务,实现了生成多样化表达的效果,相较于现有神经方法更为出色。
- EMNLP低资源形态变化的极限探究
提出一种针对低资源语言的自动词形变化生成方案,在神经网络方法、注意力机制、跨语言转移学习等方面做了改进并实现了 15% 的性能提升。发现了语言类别相似和通用表示是跨语言转移学习成功的关键因素。
- ACL具有鉴别性聚类嵌入的小型文本分类器
通过学习硬词聚类并使用 Gumbel-Softmax 分布最大化潜在聚类并最小化任务误差,我们减少了神经自然语言处理方法中嵌入参数的模型大小。我们提出了一些变体,可以选择性地为单词分配额外的参数,从而在仍然保持参数有效的情况下进一步提高准确 - ACL情感分析问题尚未解决!评估和探究情感分类
本文提出使用神经网络方法进行情感分析,从而有效解决相关问题,同时提供了一个数据集用于挑战现有的情感分类器在处理逻辑和语言现象方面的表现。
- ACL学习对虚构角色的情感关系进行分类:皱眉的弗罗多、畏缩的莱娅和严肃的友谊
本文介绍了一个新的任务 - 将小说角色之间的情感关系分类,并针对该任务提出了两个子任务:角色识别和情感关系分类。通过多种不同的神经网络方法建立了情感关系分类模型,最终达到了 0.45 F1 指标。
- ACL探索用于解析话语表示结构的神经方法
提出了一种基于 Neural 的序列到序列的语义解析器,它能够高准确率地产生英语句子的 DRSs,并通过引入 De Bruijn 索引消除变量名以提高解析器性能,以及加入银标注数据来进一步提高性能。
- EMNLP实体跟踪改善填空式阅读理解
本文探索基于简单神经方法的阅读理解模型在长期语境处理和记忆显著信息方面的能力,提出了两个扩展方案:增加实体特征和使用多任务跟踪目标进行训练,并在 LAMBADA 数据集上取得了优于当前最先进方法的效果,特别是在难度较高的实体示例中。