Semeval-2022 任务 1：CODWOE-- 比较词典和词嵌入

May, 2022

Semeval-2022 任务 1：CODWOE-- 比较词典和词嵌入

Semeval-2022 Task 1: CODWOE -- Comparing Dictionaries and Word Embeddings

Timothee Mickus, Kees van Deemter, Mathieu Constant, Denis Paperno

TL;DR本文主要研究了如何在多语言环境下，通过对比训练得到的词嵌入向量，将人类可读的定义和向量联系起来的问题。

Abstract

word embeddings have advanced the state of the art in NLP across numerous tasks. Understanding the contents of dense neural representations is of utmost interest to the →

word embeddings dense neural representations computational semantics multilingual comparable sets

发现论文，激发创造

SemEval2022 任务 1 中的 IRB-NLP：探索词语和它们的语义表示之间的关系

本篇论文研究了词与其描述或嵌入之间的关系，探索了定义建模和反向字典两个学习任务之间的关系，旨在探讨词语及其语义表示之间的关系，并在 CODWOE 数据集上展示了定义建模和反向字典任务系统的设计及实验结果。

May, 2022

基于指南针对齐的分布式嵌入，用于研究语料库间的语义差异

本文提出了一个通用框架，用于支持使用单词嵌入进行跨语料库的语言研究，其中可以比较从不同语料库生成的嵌入项，以找出语料库之间的含义对应和差异。该框架的核心组件是 CADE，重点解决了从不同语料库生成的嵌入项的对齐问题。经过实验，结果表明 CADE 在时间词嵌入，语言本地化和主题分析等各个领域都达到了最先进或更优异的性能。

Apr, 2020

定义建模：学习在自然语言中定义词嵌入

本文研究如何利用分布式表示生成单词的字典定义，介绍了几种基于 RNN 的定义模型，探讨了字母级别卷积层对词级嵌入的补充，最终通过错误分析揭示了模型的缺陷。

Dec, 2016

UiO-UvA 在 SemEval-2020 任务 1 中：用于词汇语义变化检测的上下文嵌入

该研究应用上下文化词嵌入到 SemEval-2020 Shared Task 1 的词汇语义变化检测中，着重于子任务 2，在两种上下文化体系结构（BERT 和 ELMo）和三种变化检测算法方面，分析了其性能。我们发现，最有效的算法依赖于平均令牌嵌入之间的余弦相似度和令牌嵌入之间的成对距离。他们比强基线模型高出很大的差距，但是有趣的是，选择特定算法取决于测试集中金标准分数的分布。

Apr, 2020

使用词相似性任务评估词嵌入存在的问题

使用词相似度任务作为词向量内在评估的代理，但没有标准化的词向量外部评估方法。本文探讨了使用词相似度数据集进行词向量评估时存在的问题，并总结已有的解决方案，最后指出这种方法不具可持续性，需要进一步研究词向量的评估方法。

May, 2016

阅读理解中词嵌入的比较研究

本研究针对阅读理解任务过往的机器学习研究，发现所使用的预训练词向量和测试时的未登录词处理方法等看似微小的选择，比起架构选择对最终性能的影响更大。我们对这些选择进行系统探讨，为从事该领域研究的学者提供建议。

Mar, 2017

基于语义概念嵌入的文本相似度估计

通过结合传统词嵌入和语义概念嵌入，基于多网语义网络形式化提出的语义概念嵌入（CE）能够提高预测目标群体的准确性。

Jan, 2024

用视觉对齐的单词嵌入来改善零样本学习

本文提出了一个目标函数来将分布式词嵌入与视觉信息重新对齐，通过学习将其映射到一个新的表示形式 —— 视觉对齐词嵌入（VAWE），从而使 VAWE 的邻域结构与视觉领域中的结构类似，以克服分布式词嵌入和视觉相似性不匹配的问题。经过四种最先进的零 - shot 学习方法和四个基准数据集的评估，VAWE 表现出了持续的性能改进。

Jul, 2017

评估无监督的荷兰语单词嵌入作为语言资源

本文探讨使用基于计数和基于预测结构构建的多种类型词向量嵌入在两个特定任务中的表现，即关系评估和方言识别，同时展示了这些嵌入的实用性以及在下游任务中的有效性。

Jul, 2016

SemEval-2017 任务 2 中的 ConceptNet: 用多语言关系知识扩展词嵌入

使用基于 ConceptNet 的知识图谱和分布式语义学，第一次在 SemEval 2017 任务 2 “多语和跨语义词相似度” 中构建高质量多语词嵌入，目前在与多种语言相关的子任务中占据第一名。

Apr, 2017