一种二次 0-1 规划方法用于词义消岐
本研究使用主题模型的形式设计了一种词义消歧系统,使其在上下文单词数线性增长的情况下扩展,该方法在 5 个英语全单词 WSD 数据集上进行的评估表明,其性能优于这一领域的当前最先进无监督知识为基础的 WSD 系统。
Jan, 2018
本文提出了一种基于多语言词典建立知识和监督为基础的多语言词义消歧(MWSD)系统的方法,利用统一的语义表示,将多种语言的注释进行共同训练以解决 MWSD 的注释稀缺问题,并在 SemEval-13 和 SemEval-15 数据集上展示了该方法的有效性。
Oct, 2022
本文针对单词语义消歧(WSD)问题,对现有的监督学习方法在真实世界场景中处理噪声和分布不均问题时不足的问题进行研究。首先比较了几种不确定性评分方法,然后通过测试场景对数据和模型的不确定性进行分析并探究了对其产生影响的多种词汇属性。
May, 2023
通过引入注意力机制,本文提出一种新的词义消歧方法,将多种语言特征的多重注意力权重结合在一起,构建了一个更加灵活的编码器 - 解码器模型,从而在实现高准确率的同时,缩小了模型与人类专家之间的差距。
Sep, 2018
本文提出了一种基于词汇知识的语境化嵌入模型用于词义消岐,将相关语义的词义和上下文靠近,将不相关的远离,用 Attract-Repel 目标函数和自训练目标函数对嵌入进行调整,实现了在知识为基础的词义消岐方面的最新前沿成果。
Apr, 2023
该研究论文探讨自然语言处理领域中关于理解和解决语言中的歧义的技术,强调了多义性和同音异义性等语言现象的复杂性,以及它们对计算模型的影响。论文详细介绍了从深度学习技术到利用词汇资源和知识图谱(如 WordNet)的各种方法,重点研究了词义消歧(Word Sense Disambiguation)。它引入了词义扩展(word sense extension)和神经肌阵挛方法等最新方法,通过预测新的词义来提高消歧准确性。论文还讨论了生物医学消歧和语言特定优化等具体应用,并讨论了认知隐喻在话语分析中的重要性。研究还确定了该领域存在的持续挑战,例如词义注释语料库的稀缺性和非正式临床文本的复杂性。最后,论文提出了未来的研究方向,包括使用大型语言模型、视觉词义消歧和多语言词义消歧系统,强调了在处理自然语言处理中的词汇复杂性方面的持续演进。该研究论文突显了这一领域在使计算机更准确地理解语言方面的进展。
Mar, 2024
本文提出了一种基于 MetricWSD 的非参数的少样本学习方法,通过进行情节性训练,并学习计算给定单词的不同意义之间的距离,将高频词的学习度量空间转移到低频的单词中,从而避免了在自然语言处理中监督式全单词 WSD 的一个重要挑战中的数据不平衡问题。该方法在不依赖任何词汇资源的情况下,能够获得强大的性能,并通过联合 WSD 评估基准实现了 75.1 F1 得分的良好表现。
Apr, 2021
本研究探讨了利用词义消歧算法扩大上下文范围提高神经机器翻译的效果,通过引入三种自适应聚类算法进行了验证并在 SemEval 数据上进行了评估,随后在一个最先进的 NMT 系统中联合学习单词向量和最佳 WSD 算法定义的词义向量,最终证明这种方法可以优于几个基准模型。
Oct, 2018
本研究提出了一种采用词义从不同词义库中匹配相同词义的定义句子(术语)的光泽对齐算法,并使用这些对齐的库训练模型以确定目标单词在上下文中的语义等效性,解决了有限的训练数据和集中于 WordNet 等预定义的词义库的问题;实验结果表明,所提出的方法改善了所有词义和低频词义的预测,并优于现有工作。
Oct, 2021