用户行为监督下的产品分类扩展:从所做的事情中学到所需的知识
本文提出了一种名为 TaxoExpan 的自我监督框架,使用一组 <查询概念,锚定概念> 对从现有分类法中自动生成的训练数据。通过使用这种自我监督数据,TaxoExpan 学习模拟预测查询概念是否为锚定概念的直接下位词的模型,并提出了两个创新技术:(1)增强位置的图神经网络,用于编码现有分类法中锚定概念的局部结构;(2)噪声鲁棒训练目标,使学习模型不受自我监督数据标注噪声的影响。实验结果表明,TaxoExpan 对于分类法扩展具有高效性和有效性。
Jan, 2020
本文提出了层次扩展框架 (HEF),旨在更好地利用分类法的分层结构进行分层扩展。HEF 在多个方面利用分类法的分层结构,利用亲属关系检测和几个树独特功能来评估其子树的连贯性,并引入适合度评分来选择最优位置,将信息交换用于消歧和自我纠正。该模型在三个基准数据集上的实验表明,通过更好地利用层次结构和优化分类法的连贯性,HEF 在准确性和平均倒数排名方面平均提高了 46.7% 和 32.3% 的精度,远远超过了之前的最佳水平。
Jan, 2021
本文介绍了一种基于分类术语的潜在因子模型 (TF),并将其用于推荐系统,以提高推荐精度和处理数据稀疏性和冷启动问题,该模型将分类术语与潜在因素相结合,并使用加法模型。同时,该模型还利用高阶马尔科夫链考虑到用户兴趣的时间动态和能够处理大规模数据。使用真实世界的购物数据集进行实验证明该模型比现有方法具有更好的推荐性能和运行时间。
Jun, 2012
本文提出了一种自动构建以任务为导向的分类体系的方法,名为 HiExpan,该方法通过从语料库中自动生成关键术语列表并逐步扩大种子分类体系来构建分类体系,并结合弱监督关系抽取模块来调整分类树的全局结构,实验证明该方法在不同领域的构建任务中具有良好的效果。
Oct, 2019
本文提出了 “视觉分类法扩展”(VTE),将视觉特征引入分类法扩展任务。我们提出了文本上位词学习任务和视觉原型学习任务,以聚类文本和视觉语义。除了各自的任务外,我们还引入了超原型约束,整合文本和视觉语义以产生细粒度的视觉语义。在两个数据集上对我们的方法进行评估,我们获得了令人信服的结果。特别在中文分类法数据集上,我们的方法的准确度提升了 8.75%。此外,我们的方法在中文分类法数据集上的表现优于 ChatGPT。
Sep, 2023
本文提出的 HyperExpan 算法是一种基于超平面嵌入(Hyperbolic space)的 taxonomy expansion 自动扩展算法,运用了超图神经网络和位置嵌入技术,通过表征概念及其关系来扩展现有分类体系的覆盖范围,并在分类扩展基准测试中取得最优性能。
Sep, 2021
通过使用基于指令的精调大型语言模型(LLMs),本研究提出了一种无监督方法来自动生成和扩展主题分类法。我们运用主题建模和关键词提取技术创建初始主题分类法,并使用 LLMs 对结果进行后处理以创建层次结构。为了通过新术语扩展现有分类法,我们使用零样本提示来确定在何处添加新节点,这是首次在分类任务中提出此种方法。我们使用生成的分类法为来自零售银行数据集的商户分配标签。为了评估我们的工作,我们请 12 位志愿者回答一个两部分的表格,首先评估创建的分类法质量,然后评估基于该分类法为商户分配的标签。评估结果显示所选分类法的一致性率超过 90%,而商户分配的平均一致性超过 80%。
Jan, 2024
通过利用现有的分类法作为实体关系的丰富来源,运用指导调优来微调大规模语言模型以生成父节点和同级实体,本文提出了统一的分类法指导的指令调优框架,有效地解决了实体集扩展、分类法扩展和种子引导分类法构建这三个任务,并且在多个基准数据集上的广泛实验证明了 TaxoInstruct 的有效性,其在这三个任务上优于特定任务的基线方法。
Feb, 2024
本文提出了一种基于文本和图像的概率模型,通过端到端特征设计实现自动构建上位词分类法。通过小型本体数据的判别训练,该模型可以从头开始为具有关联图像的未知概念标签构建完整的分类法。在 WordNet 层次结构的评估中,本系统的表现优于以往方法。
Jun, 2016