- EMNLP关于发现和移除语言数据中瑕疵的能力问题
本文提出 “能力问题” 类算法,理论分析了如何检测出数据集中的伪相关性问题。通过统计学上的方法,对自然语言处理中数据集偏见及其对模型的不良影响提出解决方法。
- EMNLP语言模型是少样本学习的管家
使用预训练语言模型和简单的强化学习算法,无需大量专家示范即可在文本环境中操作并取得 51% 的成功率改进。
- 神经数据扩增通过样本外推
提出了一种基于神经扩展范例(Ex2)的数据增强方法,通过从某个分布中抽样得到的一些范例向该分布中生成新范例,应用于语言理解任务中,取得了在几个少样本学习基准上显著的优化结果。
- ACL基于结构的 Transformer 的代码摘要
本研究利用结构诱导 Transformer 模型,提高源代码自动摘要生成的性能和效果。
- ACLParsiNLU: 波斯语语言理解挑战套件
本文介绍第一个波斯语 NLU 基准数据集 ParsiNLU,并在此基础上与人类表现进行比较,为波斯语理解的研究和进展提供了有价值的洞察力。
- CLIMATE-FEVER: 用于验证现实世界气候声明的数据集
介绍了 CLIMATE-FEVER 数据集,旨在促进和鼓励改进为气候特定声明检索证据支持的算法,应对语言理解挑战,并帮助减轻虚假信息对气候变化的影响。
- EMNLP多选题问答系统的期望
本研究对最近在多项选择题回答(MCQA)数据集中取得高分的模型进行扰动实验,发现其表现不符合语言理解的人类期望,提出了一种新的训练方法,使模型更好地学习输入数据并使模型性能更好。
- 研究诗歌创作系统中的社会偏见
本研究旨在探讨如何在诗歌创作系统中进行下一个诗句建议检索时减轻社会偏见,并通过情感风格转换的数据增强方法,为减轻社会偏见提供了潜在的解决方案。
- 语言中组合泛化的分层偏序解码
本文提出一种新的分层偏序集解码范例,以促进语言的组合泛化能力,并在特定于组成性泛化的自然语言问答数据集上进行了实验。
- EMNLP利用强化学习的多段落阅读理解实现互动小说游戏
该研究提出了一种基于交互式小说的自然语言处理方法,使用多次阅读理解技术和历史观察策略来解决命令生成和理解文本的挑战,进而在最新的 IF 基准测试上取得了高胜率和低数据需求的优势。
- EMNLP序列决策泛化学习
介绍了一种师徒模仿式学习方法和一种将强化学习模型转化为自然语言理解模型的方法,使得上下文化语言模型能够被引入顺序决策问题空间中,实现更好的学习速度和泛化能力。
- EMNLP视觉基础复合 PCFG
本文将视觉与语言相结合用于语言理解,采用一种基于概率无上下文文法模型的 full-differentiable 端到端视觉理解模型,在 MSCOCO 测试标题上取得了新的最佳效果,证实了视觉基础在短语结构语法归纳中的有效性。
- 带上下文的自然语言查询的机器人目标检索
我们开发了一种基于机器学习的模型,使机器人能够根据物体的用途检索物体,而不是仅针对特定的物体类型或视觉属性,从而实现了高级概念的预测和自然语言命令的推广。
- EMNLP信息瓶颈方法控制合理化提取中的简洁性
本文通过优化信息瓶颈(IB)目标的界限,提出了一种新的完全无监督方法, jointly 学习解释器和端任务预测器,通过可调的稀疏先验直接控制掩码的稀疏性水平。在 ERASER 基准任务上的实验表明,使用 IB 相比于 norm-minimi - EMNLP经验铸就语言
语言理解研究在未能将语言与其所描述的物理世界和所促进的社会互动相联系的情况下受到阻碍,因此现在的成功表示学习方法需要与涉及语言的更广泛的物理和社会背景的研究相结合来解决沟通的更深层次的问题。
- 使用连续动态模型为 Transformer 学习位置编码
提出了一种新的位置信息编码方法,使用神经常微分方法对非循环模型(如 Transformer)进行编码,并证明在翻译和理解任务中,该编码方法与已有编码方法相比具有更好的性能。
- ASR 纠错和语言理解的联合上下文建模
该研究提出了一种多任务神经网络方法,通过对话系统中的语音识别输出进行上下文语言纠正和语言理解以改善两个任务的性能,从而提高自动语音识别的质量。
- IJCAI基于探索的基于文本游戏的语言学习
本文介绍一种采用探索和模仿学习的代理程序,能够在玩基于文本的电脑游戏时表现出最先进的性能。该方法使用 Go-Explore 探索方法以及模仿学习策略去训练模型,实现了更高效的解决文本游戏和更强的泛化能力。
- AAAI填补对话省略以提高社交对话理解能力
本论文提出了一种用于解决社交对话中省略现象的方法,通过使用端到端指针网络模型对用户发言进行补全,结合原始发言和自动补全发言来进行对话行为预测和语义角色标注任务。该方法在社交对话中分别将对话行为预测和语义角色标注的 F1 分数提高了 1.3% - AAAI评估机器阅读理解数据集的基准测试能力
本篇研究提出了一种半自动化的消融实验方法,通过检查即使除去与语言理解相关的特征后是否仍然能回答问题,来评估语言理解能力挑战数据集的性能,实验结果表明,很多问题并不需要语法复杂的推理,为了精准评估 MRC 数据集,需要在设计时额外注意。