SenteCon：利用词库学习人类可解释的语言表示

ACLMay, 2023

SenteCon：利用词库学习人类可解释的语言表示

SenteCon: Leveraging Lexicons to Learn Human-Interpretable Language Representations

Victoria Lin, Louis-Philippe Morency

TL;DR本研究提出了 SenteCon 方法，该方法将文本编码为可解释性类别，从而在保持特征性能的同时提高深度语言表示的可解释性。实验证明，SenteCon 编码语言提供高水平的可解释性，并在下游任务的预测性能方面优于现有的可解释性语言表示。

Abstract

Although deep language representations have become the dominant form of language featurization in recent years, in many settings it is important to understand a model's decision-making process. This necessitates not only an →

deep language representations interpretable model interpretable features featurized sentecon

发现论文，激发创造

SentiLARE: 基于情感意识的语言表示学习与语言知识

为了提高 NLP 任务中的语言理解能力，在考虑了文本的语言学知识（例如词性标注和情感极性）的基础上，提出了一种新的语言表示模型 SentiLARE，并使用标签感知掩蔽语言模型进行预训练，实验结果表明 SentiLARE 在各种情感分析任务上取得了最新的最佳性能。

Nov, 2019

ConceptX：潜在概念分析框架

该研究提出了 ConceptX 人在循环框架，用于解释深度语言模型中预训练隐藏表达空间，并提供自动生成的基于语言本体论的概念注释，以表示这些模型中学习到的隐含概念，从而帮助注释人员标记模型中的偏见。

Nov, 2022

情境化的词义感知：从注意力到组合性

使用语义组合性建模的透明、可解释和语言学动机策略，模拟词的上下文意义编码，并且与复杂神经结构下的黑盒模型相比，显示其与语言学动机模型在给定语义任务中的竞争力。

Dec, 2023

xSense: 学习分离词义的稀疏表示和文本定义，实现可解释的词义网络

本文研究了词向量的解释问题，提出了一种算法可通过上下文信息和目标词语推断其意义，进而利用循环神经网络生成该词汇的定义，实现对词向量的直接解释。同时，作者提出了一个高质量的词汇上下文 - 定义数据集，用于词义消歧与定义建模。经实验测试，该方法在 BLEU 评分和人工评估测试中表现出卓越的性能。

Sep, 2018

超越语言：句子表示的全面调查

本文综述了句子表示学习的各种方法，包括传统的和基于深度学习的技术，并对该领域的主要贡献和挑战进行了系统梳理，结论强调了句子表示学习在自然语言处理中的重要性和面临的挑战，并提出了未来研究方向和改进句子表示质量和效率的潜在途径。

May, 2023

分析 Transformer 语言模型中的编码概念

本文提出了一个新颖的框架 ConceptX，利用聚类发现预训练语言模型中编码的潜在概念，并通过与大量人类定义的概念进行对齐进行解释。它在七个变压器语言模型上的分析揭示了有趣的见解：i）学习表示中的潜在空间以不同的程度与不同的语言概念重叠，ii）模型中的较低层由词汇概念（例如，词缀）主导，而核心语言概念（例如，形态或句法关系）在中高层中更好地表示，iii）一些编码的概念具有多面性，无法用现有的人类定义概念充分说明。

Jun, 2022

理念的理性化

提出一种自我解释模型 ConRAT，它从输入文本中提取概念，并使用关键概念的线性聚合来解释结果，以可解释性和预测性能方面超越了最先进的方法。

May, 2021

学习和评估稀疏可解释的句子嵌入

本文通过引入稀疏表示的思想将 word embeddings 应用到 sentence embeddings 中，基于主题连贯性方法引入了一种新的、定量的自动化评估指标，并在电影对话数据集和 MS COCO 数据集的场景描述上观察到了 interpretability 的提高。

Sep, 2018

上下文诱导的词嵌入编码人类词义知识的方面

本文探讨了自然语言处理中的一项工作，基于 BERT 嵌入空间来评估英语单词的多义和同音词意义之间的相关性。发现使用 BERT 嵌入模型能够在意义表示上更加清晰地捕捉多义性和同音词意的潜在结构，具有潜在的应用价值。

Oct, 2020

基于词典整合和注意力机制的情感分析卷积神经网络模型

本文提出一种将词嵌入、词表嵌入和注意力机制集成到卷积神经网络中进行情感分析的新方法，该方法在 SemEval'16 任务 4 数据集和 Stanford 情感树库上得到了比现有最先进系统更好的结果。

Oct, 2016