本文介绍了形式概念分析及其应用。FCA 是由格论推导出来的应用数学分支,将概念作为人类思维的基本单位并将数据以物体属性的形式进行分析。本篇论文特别针对 RuSSIR 2014 而编写,讨论了信息检索、机器学习、数据挖掘和知识发现、文本挖掘等多个主题以及其可视化方面。
Mar, 2017
本文首次给出了代码概括模型所发现的模式的形式化定义,并提出了一种推断正则语言文法的声学算法。 PATIC 对代码 2vec 和代码 2seq 进行了评估并发现提取出的模式受限于局部和语法代码结构并缺乏语义含义。基于这些发现,本文介绍了正式定义模式的两个新方法:评估健壮性和提高代码概括模型的准确性。
Mar, 2023
本文通过进行系统化文献综述,提供了从 1996 年到 2022 年发表的 1140 篇学术论文的方法、算法、指标和数据集的深入研究,探讨了数字联想规则挖掘的重要研究问题、现状和未来可能性,并提出了一种新颖的离散化度量来提供与人类分区感知相符的数字数据分区。
Jul, 2023
该研究提出了一种基于 FCA 的新方法,通过对文本语料库中的上下文信息进行建模和分析,以自动获取层次结构的概念分类。在旅游和金融领域应用比手工分类更有效。
Sep, 2011
本文提出了一种基于实值项集的质量评分方法,并通过将数据集转换为二进制数据并计算其支持度的方法来解决阈值问题,从而有效地发现出具有统计显著性的模式。
Feb, 2019
本文讨论模式挖掘在预测模型中的应用,并提供具有解释性和准确性的模式选择方法。
Nov, 2011
该研究在强化概念缩放的数学理论方面进行了贡献,给出了精确定义和引入了缩放维度的概念用于研究概念格结构的量化,同时进行较为详尽的性质讨论及理论边界分析。
Feb, 2023
该研究论文介绍了对比模式挖掘的研究方向,并分类讨论了各种挖掘策略和方法,包括序列模式和对比模式,提出了不同算法和优缺点,最后探讨了该领域的挑战和机遇。
Sep, 2022
本文提出了一种使用随机有限集 (RFS) 进行点模式数据建模的方法,并介绍了适当的似然函数和最大似然估计器,可以学习可操作的 RFS 模型族。在新颖性检测中,我们提出了基于 RFS 模型的新型排名函数,实现了显著的性能提升。
Jan, 2017
本文讨论了如何通过用户反馈学习模式的质量函数,并提出了使用更复杂的直接从模式排名派生的特征来替代现有方法中的低级特征,以及如何将多样性约束纳入交互式挖掘系统中。实验结果表明,在参数选择和特征工程方面的优化会提高挖掘算法的性能。
Apr, 2022