本文介绍了一种协议,它允许用户与锚定词进行交互以构建定制和可解释的主题模型,并提供了实验证据来证明我们方法的实用性。
Jun, 2019
本文提出了一种基于二阶矩的无锚点主题挖掘框架,采用一次特征值分解和少量线性规划,只需较弱的条件即可确保识别主题,并在实践中表现出更好的鲁棒性。
Nov, 2016
本文首次对 Anchors 方法进行了理论分析,针对文本分类算法,使用 TF-IDF 向量化步骤,将词语替换为固定的词汇表外标记,探究了基于规则的解释性方法在不同模型上的行为,并通过对神经网络的实证研究显示了 Anchors 选择模型输入的局部梯度相对应的词语。
May, 2022
本文提出了一种名为 “Anchor & Transform (ANT)” 的简单而高效的嵌入算法,它能够处理大容量的离散对象嵌入,通过从中学习少量的锚点和稀疏的转换矩阵,将对象嵌入成为锚点的稀疏线性组合。这种算法是可扩展、灵活和端到端训练的。同时,研究人员还将其解释为一种贝叶斯非参数先验,旨在促进稀疏性并利用对象间的自然分组关系,我们在多个基准测试中发现,ANT 特别适用于大词汇量,相较于现有压缩基线提供了更强的性能表现(高达 40 倍压缩的低参数)。
Mar, 2020
提出了一种用于视觉故事叙述任务的学习模型,其主要思想是从图片中预测锚定词嵌入,并联合使用嵌入和图片特征生成叙述句,方法设计简单,易优化,在大多数自动评估指标中取得最佳结果,在人员评估中也优于竞争方法。
Jan, 2020
使用模糊和非正式的专家知识指导文本中解释性潜在主题的发现,结合了信息瓶颈和总相关性解释方法,对 Anchored CorEx 进行了初步评估,并在两个不同的语料库上产生了更连贯和可解释的主题。
Jun, 2016
本论文提出了一种基于概率密度的单词嵌入模型 —— 密度顺序嵌入模型。该模型通过实现简单而有效的损失函数和距离度量以及基于图的方案选择负样本,学习到分层的概率密度表示。实验结果表明,此方法在 WordNet 层级关系预测任务和 HyperLex 语义蕴涵数据集上表现出了最先进的性能,并保留了丰富而可解释的密度表示。
Apr, 2018
提供了一个框架,允许用户在保持模型无关性的同时,将其领域知识的语义纳入主题模型的完善中。使用交互式视觉分析工作区支持用户完成语义空间的理解、潜在冲突和问题区域的识别以及基于对概念理解的重新调整,从而直接影响主题建模。通过操作与推荐交互相结合,目标完善旨在最小化高效的人机协同交互迭代过程所需的反馈次数,两项用户研究证实了该方法提高了主题模型质量。
Aug, 2019
基于一种概率模型,研究了嵌入学习在离散数据中的可学习性,并提出了一种用于估计的低秩近似消息传递方法,探讨了样本数量、词项频率和嵌入相关性对概率分布的影响。通过对合成数据和真实文本数据的模拟验证了理论研究的可行性。
Dec, 2023
提出了一种基于嵌入空间中的锚向量的可视化框架,能对任何神经生存分析模型使用的中间嵌入表示进行可视化,并展示了其对处理表格和图像数据的应用。
May, 2023