使用微路径的自监督分类法扩展(STEAM)
本文提出了一种名为 TaxoExpan 的自我监督框架,使用一组 <查询概念,锚定概念> 对从现有分类法中自动生成的训练数据。通过使用这种自我监督数据,TaxoExpan 学习模拟预测查询概念是否为锚定概念的直接下位词的模型,并提出了两个创新技术:(1)增强位置的图神经网络,用于编码现有分类法中锚定概念的局部结构;(2)噪声鲁棒训练目标,使学习模型不受自我监督数据标注噪声的影响。实验结果表明,TaxoExpan 对于分类法扩展具有高效性和有效性。
Jan, 2020
本文提出了一种自我监督和用户行为导向的产品分类法拓展框架,通过从现有的分类法和用户点击日志中抽取用户感兴趣的候选下义词关系并利用预训练语言模型和图神经网络结合对比学习来建模概念和关系,以自动将新概念附加到现有分类法,从而减少手动更新的人力成本。
Mar, 2022
本文提出了层次扩展框架 (HEF),旨在更好地利用分类法的分层结构进行分层扩展。HEF 在多个方面利用分类法的分层结构,利用亲属关系检测和几个树独特功能来评估其子树的连贯性,并引入适合度评分来选择最优位置,将信息交换用于消歧和自我纠正。该模型在三个基准数据集上的实验表明,通过更好地利用层次结构和优化分类法的连贯性,HEF 在准确性和平均倒数排名方面平均提高了 46.7% 和 32.3% 的精度,远远超过了之前的最佳水平。
Jan, 2021
本文提出了一种自动构建以任务为导向的分类体系的方法,名为 HiExpan,该方法通过从语料库中自动生成关键术语列表并逐步扩大种子分类体系来构建分类体系,并结合弱监督关系抽取模块来调整分类树的全局结构,实验证明该方法在不同领域的构建任务中具有良好的效果。
Oct, 2019
通过利用现有的分类法作为实体关系的丰富来源,运用指导调优来微调大规模语言模型以生成父节点和同级实体,本文提出了统一的分类法指导的指令调优框架,有效地解决了实体集扩展、分类法扩展和种子引导分类法构建这三个任务,并且在多个基准数据集上的广泛实验证明了 TaxoInstruct 的有效性,其在这三个任务上优于特定任务的基线方法。
Feb, 2024
本研究提出了一种名为 TaxoEnrich 的新的分类完成框架,它有效地利用现有分类体系中的语义特征和结构信息,并提供更好的候选位置表示以提高分类完成性能。实验结果表明,在四个来自不同领域的大型真实数据集上,TaxoEnrich 在所有评估指标上均实现了最佳性能,并且在很大程度上优于先前的最新方法。
Feb, 2022
在缺乏资源的环境中,通过利用大型语言模型的能力,本文提出了一种名为 FLAME 的新颖方法用于进行分类体系扩展,该方法利用少量样本中的提示来提取语言模型内在的知识,并采用强化学习对其进行微调,从而实现更准确的预测。实验表明,FLAME 在真实场景中取得了显著的改善,在八个基准测试上准确性提高了 18.5%,Wu & Palmer 指标提高了 12.3%。此外,通过广泛的案例研究、误差分析和消融研究,我们阐明了 FLAME 的优点和缺点。
Feb, 2024
本文提出了 “视觉分类法扩展”(VTE),将视觉特征引入分类法扩展任务。我们提出了文本上位词学习任务和视觉原型学习任务,以聚类文本和视觉语义。除了各自的任务外,我们还引入了超原型约束,整合文本和视觉语义以产生细粒度的视觉语义。在两个数据集上对我们的方法进行评估,我们获得了令人信服的结果。特别在中文分类法数据集上,我们的方法的准确度提升了 8.75%。此外,我们的方法在中文分类法数据集上的表现优于 ChatGPT。
Sep, 2023
本文提出一种新颖的强化学习方法,旨在从一组术语中自动归纳出分类法,该方法采用多种信息源学习术语对的表示,并使用策略网络确定要选择哪个术语以及将其放置在分类法中的何处,在训练分类法时通过整体树度量进行累积奖励,实验证明,该方法在两个不同领域的两个公共数据集上优于先前的最先进的分类法归纳方法高达 19.6%的祖先 F1。
May, 2018
本文提出的 HyperExpan 算法是一种基于超平面嵌入(Hyperbolic space)的 taxonomy expansion 自动扩展算法,运用了超图神经网络和位置嵌入技术,通过表征概念及其关系来扩展现有分类体系的覆盖范围,并在分类扩展基准测试中取得最优性能。
Sep, 2021