通过深度条件生成学习对时间序列的马尔可夫属性进行测试
本文提出了一种新颖的生成式概率预测方法,基于非参数时间序列的 Wiener-Kallianpur 创新表示。在生成人工智能的范式下,提出的预测架构包括一个自编码器,将非参数多变量随机过程转化为规范化的创新序列,根据过去样本的条件概率分布生成未来时间序列样本。提出了一种新颖的深度学习算法,使潜在过程成为具有匹配自编码器输入 - 输出条件概率分布的独立同分布序列。该生成式预测方法具有渐近最优性和结构收敛性质。研究了三个应用领域,包括实时市场操作中的高动态和高波动时间序列:(i) 商业储能参与者的位置边际价格预测,(ii) 互联市场的区域价格差预测,以及 (iii) 频率调节的区域控制误差预测。基于多个独立系统运营商的市场数据的数值研究表明,在概率和点预测指标下,与传统的和基于机器学习的预测技术相比,该方法具有更优越的性能。
Mar, 2024
我们提出了一种新颖的深度学习方法,用于通过离散采样估计马尔科夫过程中的时变参数。通过将参数近似重新构造为最大似然方法的优化问题,我们的方法与传统的机器学习方法有所不同。实验验证集中在多元回归和随机微分方程的参数估计上。理论结果表明,在特定条件下,具有使用我们的神经网络导出的参数近似的 SDE 接近真实解。我们的工作为基于 SDE 的模型参数估计做出了贡献,为不同领域提供了一种多功能工具。
Dec, 2023
通过建立高阶马尔可夫切换模型的可辨识性,我们提出了基于制度依赖因果关系的发现方法,并通过实证研究展示了该方法在高阶制度依赖结构估计上的可扩展性,并对脑活动数据的适用性进行了说明。
Jun, 2024
我们提出了一个通用的框架,用于构建针对大类非参数测试问题的强大的连续假设检验。该框架可以统一处理多个经典任务,如双样本测试、独立性测试和条件独立性测试,以及现代问题,如对机器学习模型的对抗鲁棒性测试。我们的方法对传统批量测试具有以下优势:1) 它持续监控在线数据流并有效地聚合针对零假设的证据,2) 它在不需要多重测试校正的情况下对类型 I 错误进行严格控制,3) 它根据问题的未知难度调整样本大小要求。我们在测试通过投票框架(testing-by-betting framework)中利用机器学习模型的表示能力方面开发了一种基于原则的方法,这是一种用于设计连续测试的博弈论方法。在合成和真实数据集上的实证结果表明,使用我们的通用框架实例化的测试在多个任务上与专门的基准测试相竞争。
Oct, 2023
提出了一种以生成对抗网络为基础的新的假设检验统计量方法,用于检测条件相关性,该方法在高维特征空间下,直接逼近编码 null 假设的条件分布,并最大程度地提高其功率,不需对分布或特征依赖形式作任何假设,在高维数据的生成及遗传数据疾病标记研究方面具有显著优势。
Jul, 2019
本研究提出了一种基于被标记的时间点过程的新事件生成模型,其通过条件生成器以及多维标记来捕捉点过程的分布,从而在多维事件空间中实现了出色的学习效率和样本生成性能的表现,并且通过在数值实验中对比其他最先进基线表明其性能优于其他方法。
May, 2023
本文研究了 Markov Switching Models 的可识别性,探讨了其在序列潜变量模型中的应用,并给出了基于非线性高斯的转移分布参数化方法,实验结果表明此方法可用于因果发现和高维时间序列分割。
May, 2023
本文研究高维条件独立性检验问题,在双生成对抗网络(GAN)的基础上提出了一种推理方法,通过多个转换函数的广义协方差度量的最大值来构建测试统计量,并采用数据分割和交叉拟合来实现理论保障条件的最小化。除了控制 Type I 错误和具有渐近一的能力外,我们的方法使用了倍增样本法,证明了在更弱且更实际可行的条件下比现有测试更可行,并且是如何利用 GAN 等最先进的深度学习工具来解决传统但具有挑战性的统计问题的一个具体例子。我们通过模拟和一个抗癌药物数据集的应用来展示了我们的测试的有效性。
Jun, 2020
该研究旨在探讨早期回答如何影响测试、调查和问卷调查中后续答案的锚定作用,介绍了来自量子物理学的非交换可观测物的概念,并倡导利用一阶马尔科夫链模型来捕捉测试和调查回答中的顺序依赖关系,以此推进我们对心理研究中序列数据固有动态的理解,并为测试和问卷调查的纵向分析提供了一个方法学框架。
Mar, 2024