tPARAFAC2:追踪(不完整)时序数据中的演变模式
利用有意义的结构指数来提高机器学习模型的预测能力,我们提出了一种后估计平滑算子方法,无需重新训练模型即可适用于广泛的机器学习任务,并在大规模时空数据集上进行了实验。
Mar, 2020
本研究研究了结合尾平均的时序差分(TD)学习算法的有限时间行为。研究发现,尾平均的TD在不需要信息的情况下,可以在期望和高概率下以最优的$O(1/t)$速率收敛,我们提出和分析了一个增加了正则化的TD变量,结论表明正则化的TD对于具有病态特征的问题是有用的。
Oct, 2022
本研究提出了一个能够更好地定位时序连续演化模式的时间序列链(TSC)定义,并提出了两个新的链质量评估指标,在实际数据检验时显著更具鲁棒性,能够揭示多个现实世界数据集中有意义规律。
Nov, 2022
基于稀疏性的参数化的非平滑正则化方法在优化问题中引入了平滑性,通过数值实验验证了该方法性能与常用的凸和非凸正则化方法相当甚至更好。
Jul, 2023
提出了一种基于tPARAFAC2的张量分解方法,通过时间正则化从时间数据中准确提取逐渐演变的模式,通过对合成数据的广泛实验表明,tPARAFAC2可以更好地捕捉底层演变的模式,优于PARAFAC2和带有时间平滑正则化的耦合矩阵分解。
Aug, 2023
提出了一种能够处理时间信息的流式数据的张量分解方法,使用高斯过程模型因子轨迹并通过构建等效的随机微分方程实现在线过滤估计,有效捕捉对象表示的时序演化。
Oct, 2023
使用监督半非负矩阵分解和频率正则化的新方法,提出了一种预测时空数据的新方法。通过矩阵分解将时空数据分解为空间和时间分量,并引入非负性约束和频率域的正则化来改善时态模式的清晰度。通过在频率域中选择特征,提供了更便于解释的频率域解释。该方法在地球物理数据分析中具有潜在广泛应用,并与GRACE数据的先前研究结果相比,提供了更清晰的可解释性。
Nov, 2023
从稀疏观测数据中学习动力系统是许多领域(包括生物学、金融学和物理学)的一个关键问题。这篇论文介绍了一种将条件粒子滤波与祖先采样和扩散模型相结合的方法,能够生成与观测数据相符合的逼真轨迹。该方法基于迭代条件粒子滤波与祖先采样生成匹配观测边缘概率的合理轨迹,并学习相应的扩散模型。该方法既为复杂约束下高质量、平滑的轨迹提供了一种生成方法,又有效近似了粒子平滑分布在经典跟踪问题中。我们在时间序列生成和插值任务上展示了该方法,包括车辆追踪和单细胞RNA测序数据。
Jun, 2024
我们对基于正则化的连续学习在一系列线性回归任务中进行了统计分析,重点在于不同正则化项如何影响模型性能。我们推导了作为先验估计器的收敛速率,考虑了由矩阵值超参数索引的广义l2正则化算法族,包括最小范数估计器和连续岭回归作为特例。随着任务的增加,我们推导了广义l2正则化估计器的估计误差的迭代更新公式,从中确定了导致最佳算法的超参数。有趣的是,超参数的选择能够有效平衡前向和后向知识转移的权衡,并适应数据异质性。此外,我们明确地推导出最佳算法的估计误差,它与先验估计器的误差同阶。相比之下,我们的最小范数估计器和连续岭回归的下界显示了它们的子优性。我们的理论分析的副产品是提出了在连续学习中早停和广义l2正则化之间的等价性,这可能具有独立的研究价值。最后,我们进行实验以补充我们的理论。
Jun, 2024
通过结合变分自动编码器(VAE)和去噪扩散概率模型(DDPM)的思想,我们提出了一种名为TimeAutoDiff的模型,用于生成时间序列表格数据。该模型能够处理各种类型的时间序列表格数据,具有良好的保真度和实用性,并且在生成速度上有显著改进;此外,它还实现了对具有异构特征的多序列时间序列表格数据的有条件生成。
Jun, 2024