提出一种统计框架来评估张量数据中的模式偏离零期望的概率,以减轻假阳性 / 虚假发现,并进一步修剪搜索空间,降低计算复杂度。结果表明,这种评估可以纳入现有的三元聚类算法中,并揭示了一些三元聚类算法的弱点。
Jun, 2023
通过 Monte Carlo 树搜索算法解决模式挖掘的多样性问题,该算法具有高效性和通用性。
Sep, 2016
FSR 算法通过使用少量重采样数据集来识别统计显著模式,并在发现显著模式时提供严格的假阳性概率保证。
Jun, 2024
本文提出一种使用多准则决策制定方法学习模式排名功能的方法,其中将不同的趣味度度量聚合成单个加权线性排名函数,使用交互式学习过程。该方法基于层次分析过程(AHP)和一组用户排名的模式来构建偏好矩阵,比较根据用户特定趣味度而言的测量的重要性。在广受欢迎的数据集上进行的实验表明,与现有技术相比,该方法显著减少运行时间并返回精确模式排名,同时对用户误差具有鲁棒性。
Mar, 2022
该研究介绍了一种基于欧式平滑度作为模式质量标准的无监督熵正则化迭代优化问题,能够高效地从高维数据中提取出稀疏的、经过排列的低维平滑模式,有效地实现了降维和特征提取,且在实际应用中能够识别同时最小化破产风险的平滑转换模式。
通过人机协作框架和随机采样算法,以设计平衡探索和利用的措施为手段,从未标记数据中高效地识别误分类模式,并运用行列式点过程构造生成器,展现了竞争性能的实验结果。
本文研究了如何利用富有多变量的序列模式获得离散多元序列数据的简明描述,并通过最小描述长度原则提出了一种高效的算法 DITTO,能够快速而准确地发现数据的高质量模式,从而提供了一个易于理解的数据总结。
Dec, 2015
本文讨论了如何通过用户反馈学习模式的质量函数,并提出了使用更复杂的直接从模式排名派生的特征来替代现有方法中的低级特征,以及如何将多样性约束纳入交互式挖掘系统中。实验结果表明,在参数选择和特征工程方面的优化会提高挖掘算法的性能。
Apr, 2022
本文探讨了 “二十个问题” 的模式识别方法的理论基础,其中通过假设检验对可能的解释集合 Y 中的真实解释集合 Η 进行限制,提出了一种逐步测试策略,并针对测试成本和后期处理成本的总成本进行了优化。
Jul, 2005
探究在高维情况下对分类器的精度验证,证明一种基于排列组合的测试方法具有连续性及德克斯特拉极限分布的高斯近似测试也具有连续性,并以高斯分布为例进一步研究了线性判别分析和 Hotelling's 测试等方法的功率。
Feb, 2016