- 词汇歧义检测与词义消歧综述
该研究论文探讨自然语言处理领域中关于理解和解决语言中的歧义的技术,强调了多义性和同音异义性等语言现象的复杂性,以及它们对计算模型的影响。论文详细介绍了从深度学习技术到利用词汇资源和知识图谱(如 WordNet)的各种方法,重点研究了词义消歧 - 为濒危语言创建词汇资源
本文旨在探讨为濒危语言生成词汇资源的方法,通过使用公共词网和机器翻译器构建双语词典和多语言词库,奠定了一个基础,尤其适用于缺乏资源的语言。
- 土耳其自然语言处理资源:关键调查
本文综述了土耳其语的语料库和词汇资源,并特别关注公开可用的资源。除了提供可用语言资源的信息,我们还提出了一系列建议,并发现了土耳其语言学和自然语言处理研究和应用构建所需的数据差距。
- ACL从词汇资源中提取的知识增强单词嵌入
提出了一种用于词向量表示的语义专业化的有效方法,使用传统的词嵌入并应用专业化方法以更好地捕捉单词之间的语义关系,结合来自丰富词汇资源(如 BabelNet)的外部知识,以及使用基于对抗式神经网络及 Wasserstein 距离的后处理专业化 - EMNLPGlossBERT: 一种具备词汇知识的词义消歧 BERT 模型
本研究致力于提高利用词汇资源和神经网络的方法进行词义消歧(WSD)的性能。我们提出了基于 BERT 的 WSD 系统,并在 SemCor3.0 上对其进行了微调,实验结果表明,我们的方法优于现有的最先进系统。
- AAAI通过对齐异构词汇语义空间实现未见词表示
本文提出了一种利用词典等词汇资源,采用图嵌入和跨语言向量空间转换技术,为未见过的单词诱导嵌入的方法,对多个基准测试进行了优化,表现出一致的性能提升。
- 比较联结意义模型:简单语言游戏引用的实证调查
研究了在语境中只提供联想信息的情况下,参考游戏中所用的联想信息类型和用于实现信息参考的词汇资源和语言习得者的实用策略,在听者行为中发现直接二元组关联的策略比词向量或语义知识图谱关联更适用,发现很少有理性言语行为的迹象。
- ACL词汇资源和自然语言处理之间的相互作用
这篇研究论文探讨在人工智能 / 自然语言处理系统中将语言学知识、世界知识和常识知识融合起来,这是一个重要的研究领域,并提出了从构建和丰富词汇资源的过程中使用自然语言处理方法,以及从词汇资源中提取有益信息来改善 NLP 应用的方法。该教程可为 - ACL将词汇注释融入神经词义消歧
该论文提出了一种新的神经网络模型 GAS,在词汇资源和上下文信息的共同作用下实现了更好的词义消歧效果。
- ACLAdvEntuRe: 带知识引导实例的文本蕴涵对抗训练
本文提出了两种互补的方法来解决在受限监督(5K-10K 训练样本)的情况下学习文本蕴涵模型的问题:一是采用知识引导的对抗样本生成器来通过仅采用少量规则模板将大型词汇资源纳入蕴涵模型中;二是提出了首个采用自然语言例句生成器进行训练的 GAN- - ACL使用单语和跨语言约束语义专业化分布式词向量空间
Attract-Repel 算法通过注入从词汇资源中提取的约束来改善词向量的语义质量,进而产生语义专业的跨语言向量空间,这有助于从高资源语言到低资源语言的语义转移,并取得了在多语种对话状态跟踪等任务中的最优结果。
- ACL利用词汇资源学习多关系数据中实体嵌入
提出了一种使用词汇资源的描述和分布式语义语料的相关信息的简单方法,以更好地初始化关系模型的训练,在 WordNet 数据集上表现出了显着的最新性能。
- ACL提高土耳其推文中命名实体识别的实验
本文研究了基于社交媒体文本的命名实体识别,旨在提高土耳其推特上的识别效果,通过放宽语言规则和扩展词汇资源,以及使用简单的标准化方案,得到了实验结果和讨论。
- 词义归纳技术的现状:一种面向资源匮乏语言的词义消歧方法
这篇论文是关于如何运用词义感知诱导方法在缺乏词汇资源的语言中初始开展词义消岐研究,并提出了一些有趣的研究重点。
- 构建加泰罗尼亚词网的方法和工具
介绍了开发加泰罗尼亚词网所采用的方法,使用的词汇资源以及旨在应用于任何其他语言的通用工具。
- 口语文本翻译的词汇主义方法
本文讨论了翻译口语英语的理论和实现问题,提出了一种基于 Whitelock 的 Shake and Bake 机器翻译范例的全自动大规模多语种自然语言处理系统,并使用词汇资源将商业传输的闭路电视信号中的 CE 输入文本翻译成简单的目标句子, - AAAI构建用于机器翻译的大规模知识库
本文研究了支持基于知识的机器翻译(KBMT)的大型本体构建,该本体合并了各种在线词典、语义网络和双语资源,以半自动的方法进行。