用户行为监督下的产品分类扩展：从所做的事情中学到所需的知识

Mar, 2022

用户行为监督下的产品分类扩展：从所做的事情中学到所需的知识

Learning What You Need from What You Did: Product Taxonomy Expansion with User Behaviors Supervision

Sijie Cheng, Zhouhong Gu, Bang Liu, Rui Xie, Wei Wu...

TL;DR本文提出了一种自我监督和用户行为导向的产品分类法拓展框架，通过从现有的分类法和用户点击日志中抽取用户感兴趣的候选下义词关系并利用预训练语言模型和图神经网络结合对比学习来建模概念和关系，以自动将新概念附加到现有分类法，从而减少手动更新的人力成本。

Abstract

taxonomies have been widely used in various domains to underpin numerous applications. Specially, product taxonomies serve an essential role in the →

taxonomies e-commerce taxonomy expansion hyponymy relations user behavior

发现论文，激发创造

TaxoExpan: 利用位置增强的图神经网络进行自监督分类扩展

本文提出了一种名为 TaxoExpan 的自我监督框架，使用一组 <查询概念，锚定概念> 对从现有分类法中自动生成的训练数据。通过使用这种自我监督数据，TaxoExpan 学习模拟预测查询概念是否为锚定概念的直接下位词的模型，并提出了两个创新技术：（1）增强位置的图神经网络，用于编码现有分类法中锚定概念的局部结构；（2）噪声鲁棒训练目标，使学习模型不受自我监督数据标注噪声的影响。实验结果表明，TaxoExpan 对于分类法扩展具有高效性和有效性。

Jan, 2020

在决策前咨询父母及其子代：充分利用层次结构进行自监督分类法扩展

本文提出了层次扩展框架 (HEF)，旨在更好地利用分类法的分层结构进行分层扩展。HEF 在多个方面利用分类法的分层结构，利用亲属关系检测和几个树独特功能来评估其子树的连贯性，并引入适合度评分来选择最优位置，将信息交换用于消歧和自我纠正。该模型在三个基准数据集上的实验表明，通过更好地利用层次结构和优化分类法的连贯性，HEF 在准确性和平均倒数排名方面平均提高了 46.7% 和 32.3% 的精度，远远超过了之前的最佳水平。

Jan, 2021

利用分类法超级推荐系统，学习用户购买行为

本文介绍了一种基于分类术语的潜在因子模型 (TF)，并将其用于推荐系统，以提高推荐精度和处理数据稀疏性和冷启动问题，该模型将分类术语与潜在因素相结合，并使用加法模型。同时，该模型还利用高阶马尔科夫链考虑到用户兴趣的时间动态和能够处理大规模数据。使用真实世界的购物数据集进行实验证明该模型比现有方法具有更好的推荐性能和运行时间。

Jun, 2012

HiExpan: 基于层次树扩展的任务导向分类构建

本文提出了一种自动构建以任务为导向的分类体系的方法，名为 HiExpan，该方法通过从语料库中自动生成关键术语列表并逐步扩大种子分类体系来构建分类体系，并结合弱监督关系抽取模块来调整分类树的全局结构，实验证明该方法在不同领域的构建任务中具有良好的效果。

Oct, 2019

朝向视觉分类学的拓展

本文提出了 “视觉分类法扩展”（VTE），将视觉特征引入分类法扩展任务。我们提出了文本上位词学习任务和视觉原型学习任务，以聚类文本和视觉语义。除了各自的任务外，我们还引入了超原型约束，整合文本和视觉语义以产生细粒度的视觉语义。在两个数据集上对我们的方法进行评估，我们获得了令人信服的结果。特别在中文分类法数据集上，我们的方法的准确度提升了 8.75%。此外，我们的方法在中文分类法数据集上的表现优于 ChatGPT。

Sep, 2023

HyperExpan：基于双曲线表示学习的分类学扩展

本文提出的 HyperExpan 算法是一种基于超平面嵌入（Hyperbolic space）的 taxonomy expansion 自动扩展算法，运用了超图神经网络和位置嵌入技术，通过表征概念及其关系来扩展现有分类体系的覆盖范围，并在分类扩展基准测试中取得最优性能。

Sep, 2021

在标记零售银行交易过程中使用零点提示的自动创建和扩展主题分类系统

通过使用基于指令的精调大型语言模型（LLMs），本研究提出了一种无监督方法来自动生成和扩展主题分类法。我们运用主题建模和关键词提取技术创建初始主题分类法，并使用 LLMs 对结果进行后处理以创建层次结构。为了通过新术语扩展现有分类法，我们使用零样本提示来确定在何处添加新节点，这是首次在分类任务中提出此种方法。我们使用生成的分类法为来自零售银行数据集的商户分配标签。为了评估我们的工作，我们请 12 位志愿者回答一个两部分的表格，首先评估创建的分类法质量，然后评估基于该分类法为商户分配的标签。评估结果显示所选分类法的一致性率超过 90％，而商户分配的平均一致性超过 80％。

Jan, 2024

面向实体集扩展和分类扩展的统一分类指导指令调整框架

通过利用现有的分类法作为实体关系的丰富来源，运用指导调优来微调大规模语言模型以生成父节点和同级实体，本文提出了统一的分类法指导的指令调优框架，有效地解决了实体集扩展、分类法扩展和种子引导分类法构建这三个任务，并且在多个基准数据集上的广泛实验证明了 TaxoInstruct 的有效性，其在这三个任务上优于特定任务的基线方法。

Feb, 2024

从多模态数据中学习概念分类法

本文提出了一种基于文本和图像的概率模型，通过端到端特征设计实现自动构建上位词分类法。通过小型本体数据的判别训练，该模型可以从头开始为具有关联图像的未知概念标签构建完整的分类法。在 WordNet 层次结构的评估中，本系统的表现优于以往方法。

Jun, 2016

通过融合关系表示增强概念生成以完成分类法

GenTaxo 通过识别需要新概念的现有分类系统中的位置，然后生成适当的概念名称，从而提高了分类完整性。

Jun, 2021