可解释的基于锚点的主题推断的低维嵌入

Nov, 2017

可解释的基于锚点的主题推断的低维嵌入

Low-dimensional Embeddings for Interpretable Anchor-based Topic Inference

Moontae Lee, David Mimno

TL;DR本文介绍了一种改进锚点算法的方法，通过在可视化的低维空间中寻找精确凸包来提高主题模型的质量和可解释性。

Abstract

The anchor words algorithm performs provably efficient topic model inference by finding an approximate convex hull in a high-dimensional <

anchor words algorithm topic model inference convex hull word co-occurrence low-dimensional embeddings

发现论文，激发创造

锚定词互动主题建模

本文介绍了一种协议，它允许用户与锚定词进行交互以构建定制和可解释的主题模型，并提供了实验证据来证明我们方法的实用性。

Jun, 2019

无 Anchor 相关主题建模：可辨识性和算法

本文提出了一种基于二阶矩的无锚点主题挖掘框架，采用一次特征值分解和少量线性规划，只需较弱的条件即可确保识别主题，并在实践中表现出更好的鲁棒性。

Nov, 2016

文本数据锚点的深度分析

本文首次对 Anchors 方法进行了理论分析，针对文本分类算法，使用 TF-IDF 向量化步骤，将词语替换为固定的词汇表外标记，探究了基于规则的解释性方法在不同模型上的行为，并通过对神经网络的实证研究显示了 Anchors 选择模型输入的局部梯度相对应的词语。

May, 2022

锚定 & 转换：为大词汇量学习稀疏嵌入

本文提出了一种名为 “Anchor & Transform (ANT)” 的简单而高效的嵌入算法，它能够处理大容量的离散对象嵌入，通过从中学习少量的锚点和稀疏的转换矩阵，将对象嵌入成为锚点的稀疏线性组合。这种算法是可扩展、灵活和端到端训练的。同时，研究人员还将其解释为一种贝叶斯非参数先验，旨在促进稀疏性并利用对象间的自然分组关系，我们在多个基准测试中发现，ANT 特别适用于大词汇量，相较于现有压缩基线提供了更强的性能表现（高达 40 倍压缩的低参数）。

Mar, 2020

通过预测故事中的锚定词嵌入进行视觉叙事

提出了一种用于视觉故事叙述任务的学习模型，其主要思想是从图片中预测锚定词嵌入，并联合使用嵌入和图片特征生成叙述句，方法设计简单，易优化，在大多数自动评估指标中取得最佳结果，在人员评估中也优于竞争方法。

Jan, 2020

通过锚定相关性解释实现可解释的主题发现

使用模糊和非正式的专家知识指导文本中解释性潜在主题的发现，结合了信息瓶颈和总相关性解释方法，对 Anchored CorEx 进行了初步评估，并在两个不同的语料库上产生了更连贯和可解释的主题。

Jun, 2016

层次密度排序嵌入

本论文提出了一种基于概率密度的单词嵌入模型 —— 密度顺序嵌入模型。该模型通过实现简单而有效的损失函数和距离度量以及基于图的方案选择负样本，学习到分层的概率密度表示。实验结果表明，此方法在 WordNet 层级关系预测任务和 HyperLex 语义蕴涵数据集上表现出了最先进的性能，并保留了丰富而可解释的密度表示。

Apr, 2018

语义概念空间：使用词嵌入投影引导主题模型的改进

提供了一个框架，允许用户在保持模型无关性的同时，将其领域知识的语义纳入主题模型的完善中。使用交互式视觉分析工作区支持用户完成语义空间的理解、潜在冲突和问题区域的识别以及基于对概念理解的重新调整，从而直接影响主题建模。通过操作与推荐交互相结合，目标完善旨在最小化高效的人机协同交互迭代过程所需的反馈次数，两项用户研究证实了该方法提高了主题模型质量。

Aug, 2019

高维度中的嵌入向量估计

基于一种概率模型，研究了嵌入学习在离散数据中的可学习性，并提出了一种用于估计的低秩近似消息传递方法，探讨了样本数量、词项频率和嵌入相关性对概率分布的影响。通过对合成数据和真实文本数据的模拟验证了理论研究的可行性。

Dec, 2023

基于角度信息的神经生存分析模型嵌入空间可视化通用框架

提出了一种基于嵌入空间中的锚向量的可视化框架，能对任何神经生存分析模型使用的中间嵌入表示进行可视化，并展示了其对处理表格和图像数据的应用。

May, 2023