将统计显著性与区分能力整合于模式发现

Jan, 2024

将统计显著性与区分能力整合于模式发现

Integrating Statistical Significance and Discriminative Power in Pattern Discovery

Leonardo Alexandre, Rafael S. Costa, Rui Henriques

TL;DR将统计显著性和判别能力准则融入现有算法，同时保持模式质量，以引导模式发现，并通过三个案例研究证明其在发现具有显著改进的模式中的重要性。

Abstract

pattern discovery plays a central role in both descriptive and predictive tasks across multiple domains. Actionable patterns must meet rigorous statistical significance criteria and, in the presence of target var

pattern discovery statistical significance discriminative power triclustering pattern quality criteria

发现论文，激发创造

TriSig：三元组聚类的统计显著性评估

提出一种统计框架来评估张量数据中的模式偏离零期望的概率，以减轻假阳性 / 虚假发现，并进一步修剪搜索空间，降低计算复杂度。结果表明，这种评估可以纳入现有的三元聚类算法中，并揭示了一些三元聚类算法的弱点。

Jun, 2023

蒙特卡洛树搜索发现多样模式的任意时间方法

通过 Monte Carlo 树搜索算法解决模式挖掘的多样性问题，该算法具有高效性和通用性。

Sep, 2016

少样本重采样高效发现显著模式

FSR 算法通过使用少量重采样数据集来识别统计显著模式，并在发现显著模式时提供严格的假阳性概率保证。

Jun, 2024

提升排序模式学习

本文提出一种使用多准则决策制定方法学习模式排名功能的方法，其中将不同的趣味度度量聚合成单个加权线性排名函数，使用交互式学习过程。该方法基于层次分析过程（AHP）和一组用户排名的模式来构建偏好矩阵，比较根据用户特定趣味度而言的测量的重要性。在广受欢迎的数据集上进行的实验表明，与现有技术相比，该方法显著减少运行时间并返回精确模式排名，同时对用户误差具有鲁棒性。

Mar, 2022

使用置换辅助的熵维度降低线性可扩展学习平滑低维模式

该研究介绍了一种基于欧式平滑度作为模式质量标准的无监督熵正则化迭代优化问题，能够高效地从高维数据中提取出稀疏的、经过排列的低维平滑模式，有效地实现了降维和特征提取，且在实际应用中能够识别同时最小化破产风险的平滑转换模式。

Jun, 2023

预测算法故障模式高效识别

通过人机协作框架和随机采样算法，以设计平衡探索和利用的措施为手段，从未标记数据中高效地识别误分类模式，并运用行列式点过程构造生成器，展现了竞争性能的实验结果。

Jun, 2023

简洁有效：使用多元模式总结复杂事件序列

本文研究了如何利用富有多变量的序列模式获得离散多元序列数据的简明描述，并通过最小描述长度原则提出了一种高效的算法 DITTO，能够快速而准确地发现数据的高质量模式，从而提供了一个易于理解的数据总结。

Dec, 2015

利用复杂的模式特征实现交互式模式挖掘

本文讨论了如何通过用户反馈学习模式的质量函数，并提出了使用更复杂的直接从模式排名派生的特征来替代现有方法中的低级特征，以及如何将多样性约束纳入交互式挖掘系统中。实验结果表明，在参数选择和特征工程方面的优化会提高挖掘算法的性能。

Apr, 2022

层次化测试设计用于模式识别

本文探讨了 “二十个问题” 的模式识别方法的理论基础，其中通过假设检验对可能的解释集合 Y 中的真实解释集合 Η 进行限制，提出了一种逐步测试策略，并针对测试成本和后期处理成本的总成本进行了优化。

Jul, 2005

作为双样本检验代理的分类准确性

探究在高维情况下对分类器的精度验证，证明一种基于排列组合的测试方法具有连续性及德克斯特拉极限分布的高斯近似测试也具有连续性，并以高斯分布为例进一步研究了线性判别分析和 Hotelling's 测试等方法的功率。

Feb, 2016