- EMNLP识别影响出版趋势与行为的因果关系:计算语言学界的案例研究
本文利用混合方法分析了互联网上关于计算语言学的出版趋势、行为对研究聚焦点 —— 方法、材料和任务 —— 的采用、持久和退役的因果影响,发现了快速新方法 —— 双向 LSTMs 的引入影响了 LSTMs 的退役,深度学习,嵌入,生成和语言模型 - EMNLP利用左角递归神经网络语法模拟人类句子处理
本文调查了上下文中的分层结构对语言模型的人类化作用,并论证了用左角解析策略的分层模型比顺序模型和自上而下解析策略的分层模型更具有认知可信度,进一步探讨了认知可信度与 perplexity、解析和 beam size 之间的关系。
- 基于模式匹配的科学实体从学术文章标题的获取
使用基于规则的方法,从计算语言学(CL)学术文章标题中自动获取突出的科学实体,从而提高实体检索的精确性和召回率。在所有 ACL Anthology 文章标题的基础上,总计提取了 19,799 个研究问题,18,111 个解决方案,20,03 - MM广义最优线性排序
本文探讨了语言处理中的单词顺序问题,并提出了基于语言学、心理语言学、计算语言学和自然语言处理的理论模型。进一步,为了优化处理单词最小化相关性,提出一种新的单词顺序,重点关注远距离依赖的人类和计算语言处理困难。最后探讨这些单词顺序对于人类语言 - ACL吹哨人:一个包含常识和世界知识的汉语数据集用于方言理解
本文提出大规模、多样化的中文数据集,用于从计算的语言学角度创建和理解非正式语言。同时,我们确立了一个任务以及提供了相应数据、数量和质量分析。实验表明,这一任务需要深度语言理解、常识和世界知识,并可以成为预训练语言模型的良好测试基准,从而帮助 - ACL社交媒体投诉严重性建模
本篇论文是第一次在计算语言学领域研究投诉的严重程度等级,在公开数据集中加入四个严重程度等级并采用不同的基于 transformer 的网络结构和语言信息来训练模型,在二进制投诉检测和投诉严重程度等级多任务设置的联合模型中达到了最新的最优结果 - MMReferentialGym: 一种命名及框架用于语言演化和(视觉)指代游戏中的基础
该论文提出了一种理解研究语言演变和基础的主要方法的词汇表,并引入了基于 PyTorch 的深度学习框架 ReferentialGym,旨在通过提供基准实现、算法和度量标准,简化领域入门难度并提供常见实现。
- 文本风格转移:评论与实验评估
本文综合评述了最近文本风格迁移的研究进展,提出了一种按类别组织 TST 模型的分类法,并提供了一份最新技术的综合摘要。我们还检验了 19 种最先进的 TST 算法并提供当前趋势的新视角。
- EMNLP非监督对话结构归纳的结构化注意力
本论文通过在变分循环神经网络模型中引入结构化注意力层,以无监督学习的方式学习对话结构,并对多方对话数据集进行了实验,展示了模型区分发言人或地址、自动脱钩对话的能力。
- 从新闻中自动提取社会政治事件(AESPEN):研讨会和共享任务报告
本研究旨在自动从新闻中提取社会政治事件,并讨论计算语言学和社会政治学研究在大规模跨源、跨国和跨语言的社会政治事件信息收集中的相互支持,研究内容包括机器学习方法学的评估、语言资源、物质冲突预测、核心参照识别等。
- EMNLP跨数千种语言建模色彩术语
本文使用多种测量方法对语言间的大量数据进行操作和批判,该方法与在许多语言中的基本颜色术语和其获取顺序相关,同时提出建议将其视为光谱而非二分法。
- AAAIScisummNet: 带有引文网络的科学论文摘要的大型注释语料库和内容影响模型
该论文提出了一种新的解决方案,通过开发和发布一个大规模的、手动注释的科学论文语料库,并提出了将作者的原始亮点(摘要)和文章对社区的实际影响(引用)整合的摘要方法,创建全面的、混合型摘要。我们进行了实验,证明了我们的语料库在训练数据驱动模型的 - SIGIRCL-SciSumm 2018 共享任务:结果与关键见解
CL-SciSumm Shared Task 2018 was held as part of SIGIR's Annual Conference, which focused on scientific document summariz - 基于共识的对话游戏:强调视觉对话环境中的交流基础
本文介绍了一种通过协议达成共识的对话设置,除任务级别目标外,还有一个次要的、显式的目的 —— 达成对任务级别目标是否达成的共识 —— 使得会话参与者更关心彼此的理解,从而产生更丰富的数据以推导模型。
- 手语识别、生成和翻译:跨学科视角
本文介绍了一个跨学科的研究小组,他们探讨了手语识别及其翻译的挑战,讨论了需要在计算机视觉、自然语言处理、人机交互、计算机图形学、语言学和聋文化等领域集成知识的必要性,并提出了解决这些挑战的呼吁。
- SIGIRCL-SciSumm 共享任务 2019 概述与结果
该论文介绍了 2019 年 CL-SciSumm 共享任务,包括三个任务:确定引用文献与被引用文献间的关系,分类表述要素和生成概括性摘要等,使用 40 个带有注释的 CL-SciSumm 2018 语料库和 1000 个来自 SciSumm - 论证挖掘的演进:从模型到社交媒体和新型工具
本综述文章桥接了论证挖掘的理论方法和社交媒体数据诉求的实用方案之间的差距,回顾、比较和分类现有方法、技术和工具,识别了结合任务和特征的积极成果,并最终提出了一个观点架构框架。该理论框架是一种能够识别不同子任务并捕捉社交媒体文本需求的论证挖掘 - ACL评估序列到序列模型的增量性
该研究提出三个新的指标以评估具有和不具有注意力机制的 RNN 的行为,发现不同模型类型处理句子的方式存在关键差异,这揭示了人类和注意力中心方法在语言处理方面的行为上存在的显著对比。
- ACL双极性障碍患者个人康复的计算语言学研究
本跨学科研究项目旨在收集和分析社交媒体数据来研究被诊断为双相情感障碍的人群的个人康复经历,旨在探讨个人康复在双相情感障碍中的各个方面和机制。
- ACL无监督对话结构学习
通过使用改良后的 VRNN 模型和离散潜在向量来提取对话结构,我们的方法在预测未见数据方面具有优异性能,并在加入对话结构后的奖励功能设计实现了更快的强化学习收敛和更好的结果。