朝向视觉分类学的拓展

MMSep, 2023

Towards Visual Taxonomy Expansion

Tinghui Zhu, Jingping Liu, Jiaqing Liang, Haiyun Jiang, Yanghua Xiao...

TL;DR本文提出了 “视觉分类法扩展”（VTE），将视觉特征引入分类法扩展任务。我们提出了文本上位词学习任务和视觉原型学习任务，以聚类文本和视觉语义。除了各自的任务外，我们还引入了超原型约束，整合文本和视觉语义以产生细粒度的视觉语义。在两个数据集上对我们的方法进行评估，我们获得了令人信服的结果。特别在中文分类法数据集上，我们的方法的准确度提升了 8.75%。此外，我们的方法在中文分类法数据集上的表现优于 ChatGPT。

Abstract

taxonomy expansion task is essential in organizing the ever-increasing volume of new concepts into existing taxonomies. Most existing methods focus exclusively on using textual semantics, leading to an inability to generalize to unseen terms and the "Prototypical Hypernym Problem." In

taxonomy expansion visual taxonomy expansion visual features textual hypernymy learning visual prototype learning

发现论文，激发创造

从多模态数据中学习概念分类法

本文提出了一种基于文本和图像的概率模型，通过端到端特征设计实现自动构建上位词分类法。通过小型本体数据的判别训练，该模型可以从头开始为具有关联图像的未知概念标签构建完整的分类法。在 WordNet 层次结构的评估中，本系统的表现优于以往方法。

Jun, 2016

用户行为监督下的产品分类扩展：从所做的事情中学到所需的知识

本文提出了一种自我监督和用户行为导向的产品分类法拓展框架，通过从现有的分类法和用户点击日志中抽取用户感兴趣的候选下义词关系并利用预训练语言模型和图神经网络结合对比学习来建模概念和关系，以自动将新概念附加到现有分类法，从而减少手动更新的人力成本。

Mar, 2022

HiExpan: 基于层次树扩展的任务导向分类构建

本文提出了一种自动构建以任务为导向的分类体系的方法，名为 HiExpan，该方法通过从语料库中自动生成关键术语列表并逐步扩大种子分类体系来构建分类体系，并结合弱监督关系抽取模块来调整分类树的全局结构，实验证明该方法在不同领域的构建任务中具有良好的效果。

Oct, 2019

HyperExpan：基于双曲线表示学习的分类学扩展

本文提出的 HyperExpan 算法是一种基于超平面嵌入（Hyperbolic space）的 taxonomy expansion 自动扩展算法，运用了超图神经网络和位置嵌入技术，通过表征概念及其关系来扩展现有分类体系的覆盖范围，并在分类扩展基准测试中取得最优性能。

Sep, 2021

TaxoExpan: 利用位置增强的图神经网络进行自监督分类扩展

本文提出了一种名为 TaxoExpan 的自我监督框架，使用一组 <查询概念，锚定概念> 对从现有分类法中自动生成的训练数据。通过使用这种自我监督数据，TaxoExpan 学习模拟预测查询概念是否为锚定概念的直接下位词的模型，并提出了两个创新技术：（1）增强位置的图神经网络，用于编码现有分类法中锚定概念的局部结构；（2）噪声鲁棒训练目标，使学习模型不受自我监督数据标注噪声的影响。实验结果表明，TaxoExpan 对于分类法扩展具有高效性和有效性。

Jan, 2020

利用文本和图形向量表示来丰富分类学

本文研究领域为知识图谱，提出了一种基于图结构表示与深度学习的分类体系扩展方法，实验结果表明该方法在多个数据集上具有优异的效果。

Jan, 2022

通过融合关系表示增强概念生成以完成分类法

GenTaxo 通过识别需要新概念的现有分类系统中的位置，然后生成适当的概念名称，从而提高了分类完整性。

Jun, 2021

在决策前咨询父母及其子代：充分利用层次结构进行自监督分类法扩展

本文提出了层次扩展框架 (HEF)，旨在更好地利用分类法的分层结构进行分层扩展。HEF 在多个方面利用分类法的分层结构，利用亲属关系检测和几个树独特功能来评估其子树的连贯性，并引入适合度评分来选择最优位置，将信息交换用于消歧和自我纠正。该模型在三个基准数据集上的实验表明，通过更好地利用层次结构和优化分类法的连贯性，HEF 在准确性和平均倒数排名方面平均提高了 46.7% 和 32.3% 的精度，远远超过了之前的最佳水平。

Jan, 2021

tax2vec: 从分类法中构建可解释特性，用于短文本分类

本文探讨了利用词汇分类学构建新的语义特征来提高文本分类任务精度和鲁棒性的方法，提出了一种基于分类学的特征构建并行算法 tax2vec，在性别、人格类型、年龄、新闻主题、药品副作用和药效预测等 6 个短文本分类问题上表现出与基于层次注意力神经网络等强基线方法相当的分类性能，同时在少量样本的学习情况下也表现出卓越的性能。算法能够提取特定于语料库的语义关键词，并且语义特征与著名的 Zipf 定律具有相似性。

Feb, 2019

通过层次感知的主题短语生成扩展话题分类

TopicExpan 是一种新的主题分类扩展框架，它结合了基于文本内容和新主题周围的层级关系结构，直接生成新主题相关的术语，实验结果表明，它在两个真实文本语料库中的表现显著优于其他基线方法。

Oct, 2022