- 将挪威 UD 树库与实体和指代信息对齐
本文提出了一个整合了个体和共指注释数据的合并集合,该集合基于挪威两种书写形式中的通用依赖 (UD) 树库,即 Bokmål 和 Nynorsk。该合并后的数据集提供了首个挪威 UD 树库,其中包含命名实体和共指信息。
- VER: 为实体和关系生成自然语言表示的学习方法
本文提出了 VER 模型,旨在利用自然语言描述实体之间的关系。该模型能够生成描述实体和实体关系的高质量句子,并为定义建模、关系建模和生成通用常识推理等任务提供了便利。
- 从密集视频字幕中提取语义元数据
通过使用 MT 和 PVDC 生成视频字幕,我们提出了一个从自动生成的视频字幕中提取语义元数据的框架。 我们的实验表明,可以从生成的字幕中提取实体,属性,实体之间的关系和视频类别。
- EMNLP基于查询的实例区分网络用于关系三元组抽取
我们提出了一种基于查询的方法,用于构建关系三元组的实例级表示,然后通过对比学习,实现了关系三元组实例级表示的学习和全局信息连接,最终在五个广泛使用的基准测试中达到了最先进的水平。
- 基于实体感知语法树的数据增强方法用于自然语言理解
本文提出了一种新的自然语言处理数据增强技术,称为 “实体感知数据增强(EADA)”,它通过应用实体感知语法树(EAST)来生成大量的训练实例,从而用于意图检测和槽填充,实验证明该技术在精度和泛化能力方面均优于现有的数据增强方法。
- ACL建模面向过程 - 多模式机器理解的时态 - 语态实体图
该研究利用设计的时空跨模态实体图(TMEG)来对多媒体文档进行精细级别的机器理解。在 CraftQA 上进行的综合实验表明了 TMEG 的有效性。
- RDF2vec 的实体和属性遍历方式
RDF2vec 是一种知识图谱嵌入机制,从知识图中提取实体的序列,然后使用 word2vec 算法计算实体的向量表示,新引入的 e-walks 和 p-walks 强调实体的结构或邻域,可用于创建重点相似性或相关性的嵌入。
- 短文本分类的 Prompt-Learning
本文介绍了基于知识拓展的 Prompt-learning 方法来解决短文本分类中的标签扩展问题,并在三个著名数据集上实验,结果比其他方法均取得了显著提高。
- 电子商务产品知识图谱嵌入
本文提出一种新的产品知识图谱嵌入方法,用于学习电子商务中作为产品知识的内在产品关系,并在真实世界数据集上验证其性能。
- 模块化文本接地实现对反事实韧性
本研究提出一种基于图像级注释的端到端可训练文本地位系统,具有对抗性鲁棒性和逐渐分解文本描述的能力,通过一系列实验验证了该模型优于现有文本定位方法的性能,尤其是对抗性类别方面性能表现突出。
- KDD维基百科子文章匹配的神经文章对建模
本文提供了一种将零散的次级维基百科文章匹配回其对应的主要文章的方法,以便于自动化维基百科管理和处理,并使用多种变体的神经文档对编码器结合全面的显式特征的分层学习结构。该方法在一个大型众包数据集上获得了令人满意的交叉验证结果,并显著优于以前的 - ACL面向知识库的需求加权完整性预测
本文提出了 “权重完备性” 的概念,该概念可以评估知识库对其实际使用的完备性。本研究利用实体的类别和使用数据来预测实体之间关系的概率分布,从而检测知识库中的重要空缺并确定未曾收录实体的相关信息。同时,本论文还展示了一个用于测量权重完备性的简 - 胶囊间的动态路由
本文从 Capsules 和 neurons 的角度出发,探讨了用长度和方向来表示实体的存在概率和实例化参数的方法,并引入了迭代路由一致性机制,设计了一个多层 Capsule 系统,在 MNIST 上表现优异。
- ACL实体核指关联的无监督排名模型
本文提出了一个基于生成模型,引入 resolution mode 变量的无监督排名模型,用于实体的共指消解。该无监督系统在 CoNLL-2012 共享任务的英文数据上,通过 CoNLL 指标得分为 58.44%,超过了 Stanford 确