- 常识因果关系的奥德赛:从基础指标到前沿推理
通过综合 200 篇代表性文献的见解,我们的综合调查桥接了对常识因果推理的认知差距,并在共识因果关系的分类、基准、获取方法、定性推理和定量测量方面提供了系统的概述、最新研究进展、新手们的实用指南以及未来研究方向的重要提示。
- 找出父级,然后标记子级:使用预训练语言模型的两阶段分类法完成方法
本文提出了名为 ATTEMPT 的两阶段方法,通过找到父节点并标记子节点的方式,将新概念插入正确的位置。利用预训练的语言模型进行上下位关系识别,通过合并本地节点和提示生成自然语句。实验结果表明,ATTEMPT 在分类系统补全和扩展任务上表现 - FLAME: 利用大型语言模型进行无监督低资源分类体系扩展
在缺乏资源的环境中,通过利用大型语言模型的能力,本文提出了一种名为 FLAME 的新颖方法用于进行分类体系扩展,该方法利用少量样本中的提示来提取语言模型内在的知识,并采用强化学习对其进行微调,从而实现更准确的预测。实验表明,FLAME 在真 - 关于解释不公正现象的概述
算法公平性和可解释性是实现负责任人工智能的基本要素。本文关注它们之间的相互关系,即最近受到越来越多关注的研究领域。我们首先提出了两种综合分类法,分别代表了公平性和解释两个互补的研究领域。然后,我们将用于公平性的解释分为三种类型:(a)用于增 - 基于模型生命周期的垂直联邦学习中隐私威胁与防御调查
综述了垂直联邦学习中的隐私攻击和防御方法,提供了攻击和防御的分类方法,并讨论了未来的研究方向和挑战,为研究人员提供了资源,为从业者在机器学习模型的生命周期中保护数据隐私提供明确指导和可行的见解。
- 逼迫还是微调?大型语言模型在分类构建中的比较研究
通过对大规模语言模型进行提示,可以在受限结构约束下构建符合要求的分类法,相比微调方法模型的性能更好,但处理由提示方法生成的分类法违规的情况具有挑战性。
- 关于图上不平衡学习的调查:问题、技术和未来方向
这篇综述论文对不平衡图学习领域的文献进行了全面的回顾,提出了两个详尽的分类方法,并为读者建立了扎实的基础理解。该领域研究主要集中在图分析、数据不平衡以及相关的解决方法上,为读者在方法选择方面提供了指导,并展望了未来的研究方向以促进创新。
- BI-LAVA:通过主动学习和视觉分析进行层次化图像标注的生物鉴定
通过多年与生物校正员和文本挖掘研究人员的合作,我们提出了一种迭代的视觉分析和主动学习策略,用于处理生物校正中的挑战。我们在一个名为 BI-LAVA 的系统中实现了这种策略,通过主动学习和可视化分析来进行带有层次图像标签的生物修正。BI-LA - ACLRaTE: 填补空白的可重复自动分类评估
自动分类评估(ATE)与分类构建同样重要。我们提出 RaTE 作为自动无标签分类评分的方法,并将其应用于三种先进的自动分类算法,构建了七个 Yelp 领域的分类体系。结果显示:1)RaTE 与人类评判相关,2)对分类体系进行人工降级会导致 - 图像线段检测与描述的全面综述:分类、比较与挑战
综述了关于二维图像线段的检测和描述的研究,提出了两个线段检测和描述的分类,并分析和总结了现有的方法的关键问题、核心思想、优缺点以及其潜在的应用,同时评估了一些最新的线段检测和描述算法,以指导研究人员选择最佳的方法进行视觉应用。
- 人类中心视角下的人工智能鲁棒性:技术挑战和机遇
对近期关于 AI 鲁棒性的研究进展进行系统性调查,提出了三个分类学来组织和描述文献,并强调人类在评估和提高 AI 鲁棒性方面的关键作用。
- 基于种子的专家设计分类体系的分层聚类
本文提出 HierSeed 方法,它是一种弱监督算法,使用少量标记示例将未标记数据自适应拟合到专家制定的分类法中。它通过权衡文档密度和主题分层结构来分配文档到主题,并在三个真实数据集上优于 SHC 任务的无监督和有监督基线。
- 用户行为监督下的产品分类扩展:从所做的事情中学到所需的知识
本文提出了一种自我监督和用户行为导向的产品分类法拓展框架,通过从现有的分类法和用户点击日志中抽取用户感兴趣的候选下义词关系并利用预训练语言模型和图神经网络结合对比学习来建模概念和关系,以自动将新概念附加到现有分类法,从而减少手动更新的人力成 - MSeg:用于多领域语义分割的综合数据集
本文介绍了 MSeg 数据集,它统一了不同领域的语义分割数据集,消除了不一致的分类和注释方法,并在零样本交叉数据集转移方面进行了评估,并表明 MSeg 训练可以显著提高模型的鲁棒性和泛化能力。
- KDDOctet: 在线编目自监督丰富分类法
本文提出了一种名为 Octet 的自我监督端到端框架,用于在线目录分类法的增强,该框架利用了用户查询、物品及其与分类法节点的关系等在线目录分类法的异构信息,并采用序列标注模型进行术语提取,采用图神经网络来捕获分类法结构以及查询项与分类法的交 - WWWTaxoExpan: 利用位置增强的图神经网络进行自监督分类扩展
本文提出了一种名为 TaxoExpan 的自我监督框架,使用一组 <查询概念,锚定概念> 对从现有分类法中自动生成的训练数据。通过使用这种自我监督数据,TaxoExpan 学习模拟预测查询概念是否为锚定概念的直接下位词的模型,并提出了两个创 - GDPR 与音频数据: 法律与技术社区的反思,迈向共同理解的第一步
本文旨在启动关于语音数据保护的讨论并提出了安排和优先考虑未来研究的建议,讨论了语音技术和数据隐私交叉点处的分类学的需求以及 GDPR 对语音数据的影响问题。
- CN-Probase:面向大规模的中文分类体系构建的数据驱动方法
本文提出了一种自动构建大规模高质量中文分类体系的方式 —— 从多个中国百科全书中提取 isA 关系,并通过三种启发式方法来验证。最终建立了精度约为 95% 的最大的中文分类体系 CN-Probase。
- 利用分类法超级推荐系统,学习用户购买行为
本文介绍了一种基于分类术语的潜在因子模型 (TF),并将其用于推荐系统,以提高推荐精度和处理数据稀疏性和冷启动问题,该模型将分类术语与潜在因素相结合,并使用加法模型。同时,该模型还利用高阶马尔科夫链考虑到用户兴趣的时间动态和能够处理大规模数