SensePOLAR：针对预训练上下文词嵌入的词义感知可解释性

EMNLPJan, 2023

SensePOLAR：针对预训练上下文词嵌入的词义感知可解释性

SensePOLAR: Word sense aware interpretability for pre-trained contextual word embeddings

Jan Engler, Sandipan Sikdar, Marlene Lutz, Markus Strohmaier

TL;DR该研究提出 SensePOLAR, 一种扩展的 POLAR 框架，可以为预训练的上下文词嵌入提供词义感知的可解释性，以达到与原来的上下文词嵌入相同的性能表现。

Abstract

Adding interpretability to word embeddings represents an area of active research in text representation. Recent work has explored thepotential of embedding words via so-called →

interpretability word embeddings polar dimensions polysemy sensepolar

发现论文，激发创造

POLAR 框架：极性相反促进预训练词嵌入可解释性

采用语义差异的方法给预训练的词嵌入加上可解释性，构建了 POLAR 框架，可以从极性反义词之间的比例上见识到单个词的语义，该框架通过选择最有区分力的维度在保持性能的同时达到了词嵌入的可解释性。

Jan, 2020

xSense: 学习分离词义的稀疏表示和文本定义，实现可解释的词义网络

本文研究了词向量的解释问题，提出了一种算法可通过上下文信息和目标词语推断其意义，进而利用循环神经网络生成该词汇的定义，实现对词向量的直接解释。同时，作者提出了一个高质量的词汇上下文 - 定义数据集，用于词义消歧与定义建模。经实验测试，该方法在 BLEU 评分和人工评估测试中表现出卓越的性能。

Sep, 2018

上下文中的迷失？关于上下文化词向量的意义差异

揭示了上下文化单词嵌入的一些特征，包括上下文中单词意思的变化程度，单词在不同上下文中的一致性，以及单词位置偏差的影响，并提出一种减轻这种偏差的简单方法。

Aug, 2022

上下文诱导的词嵌入编码人类词义知识的方面

本文探讨了自然语言处理中的一项工作，基于 BERT 嵌入空间来评估英语单词的多义和同音词意义之间的相关性。发现使用 BERT 嵌入模型能够在意义表示上更加清晰地捕捉多义性和同音词意的潜在结构，具有潜在的应用价值。

Oct, 2020

词义的线性代数结构及其在多义词中的应用

本论文提出了一种技术，可以在词嵌入空间中对多义词词义进行线性分解，以及使用稀疏编码恢复指向这些词义的向量，并通过实证研究验证了该技术。

Jan, 2016

上下文词嵌入的逐步语义权重训练

本研究提出一种新颖的在线算法，通过最小化上下文嵌入组内的距离来学习单词嵌入中每个维度的本质，以三种最先进的基于神经网络的语言模型 Flair、ELMo 和 BERT 生成上下文嵌入，为同一词汇类型生成不同的嵌入，这些嵌入由 SemCor 数据集手动标注的意义进行分组，结论表明本文提出的算法不会损伤性能，甚至能提高 3%，可以用于未来关于上下文嵌入可解释性的研究。

Nov, 2019

PolyLM: 通过语言模型学习多义词

PolyLM 是一种基于语言建模的词义嵌入方法，能够融合上下文化嵌入技术，通过对词义的建模及概率计算实现更加准确的词义感知，在词义感知任务上性能优于先前的方法，且只有现有方法参数数量的六分之一。

Jan, 2021

深度上下文词表示

本文介绍了一种新型的深层上下文词表示方法，既能够建模单词用法的复杂特征 (如句法和语义)，又能够建模这些用法在语言上下文中的变化 (即建模多义性)，这些表示可以轻松地添加到现有模型中，并且可以显著提高 NLP 问题的性能。

Feb, 2018

基于多分辨率上下文嵌入网络的无监督词汇多义数量化

本文提出了一种基于上下文嵌入空间中的简单几何形式的新颖方法来评估多义性，该方法是完全无监督和纯数据驱动的，能够较好地反映来自 WordNet、OntoNotes、Oxford 和维基百科等 6 种不同标准度量方法的排名，并能对人工排名之间的相关性进行可视化和分析。同时，该方法的一个有价值的附带产品是在不增加成本的情况下进行不同词义的样本句子抽取。最后，完全无监督的本方法使其适用于任何语言。

Mar, 2020

多义性的几何学

本文提出了一种三倍增的方法来进行无监督的多义词建模，其中使用低秩子空间来表示包含目标单词的句子，通过对表示的格拉斯曼几何进行聚类算法对目标单词的不同义项进行消歧辨别，最后基于英文维基百科语料库得出了多个词和词义对的表示，这些算法在标准意义识别和消歧辨别数据集上带来了新的最佳成果。

Oct, 2016