Semeval-2022 任务 1:CODWOE-- 比较词典和词嵌入
本篇论文研究了词与其描述或嵌入之间的关系,探索了定义建模和反向字典两个学习任务之间的关系,旨在探讨词语及其语义表示之间的关系,并在 CODWOE 数据集上展示了定义建模和反向字典任务系统的设计及实验结果。
May, 2022
本文提出了一个通用框架,用于支持使用单词嵌入进行跨语料库的语言研究,其中可以比较从不同语料库生成的嵌入项,以找出语料库之间的含义对应和差异。该框架的核心组件是 CADE,重点解决了从不同语料库生成的嵌入项的对齐问题。经过实验,结果表明 CADE 在时间词嵌入,语言本地化和主题分析等各个领域都达到了最先进或更优异的性能。
Apr, 2020
本文研究如何利用分布式表示生成单词的字典定义,介绍了几种基于 RNN 的定义模型,探讨了字母级别卷积层对词级嵌入的补充,最终通过错误分析揭示了模型的缺陷。
Dec, 2016
该研究应用上下文化词嵌入到 SemEval-2020 Shared Task 1 的词汇语义变化检测中,着重于子任务 2,在两种上下文化体系结构(BERT 和 ELMo)和三种变化检测算法方面,分析了其性能。我们发现,最有效的算法依赖于平均令牌嵌入之间的余弦相似度和令牌嵌入之间的成对距离。他们比强基线模型高出很大的差距,但是有趣的是,选择特定算法取决于测试集中金标准分数的分布。
Apr, 2020
使用词相似度任务作为词向量内在评估的代理,但没有标准化的词向量外部评估方法。本文探讨了使用词相似度数据集进行词向量评估时存在的问题,并总结已有的解决方案,最后指出这种方法不具可持续性,需要进一步研究词向量的评估方法。
May, 2016
本研究针对阅读理解任务过往的机器学习研究,发现所使用的预训练词向量和测试时的未登录词处理方法等看似微小的选择,比起架构选择对最终性能的影响更大。我们对这些选择进行系统探讨,为从事该领域研究的学者提供建议。
Mar, 2017
本文提出了一个目标函数来将分布式词嵌入与视觉信息重新对齐,通过学习将其映射到一个新的表示形式 —— 视觉对齐词嵌入(VAWE),从而使 VAWE 的邻域结构与视觉领域中的结构类似,以克服分布式词嵌入和视觉相似性不匹配的问题。经过四种最先进的零 - shot 学习方法和四个基准数据集的评估,VAWE 表现出了持续的性能改进。
Jul, 2017
本文探讨使用基于计数和基于预测结构构建的多种类型词向量嵌入在两个特定任务中的表现,即关系评估和方言识别,同时展示了这些嵌入的实用性以及在下游任务中的有效性。
Jul, 2016
使用基于 ConceptNet 的知识图谱和分布式语义学,第一次在 SemEval 2017 任务 2 “多语和跨语义词相似度” 中构建高质量多语词嵌入,目前在与多种语言相关的子任务中占据第一名。
Apr, 2017