自动无监督张量挖掘与质量评估
本文提出了一种基于草图的快速随机张量CP分解算法,通过FFT计算张量收缩并使用对称张量的冲突哈希进一步节省计算时间,结合白化和张量幂迭代技术,此算法在稀疏和密集张量上都具有最快的速度,适用于主题建模等应用。
Jun, 2015
本文介绍了张量网络及其运算的简介并侧重于介绍用于数据/参数的超压缩高阶表示的张量网络模型及其应用, 包括支持张量机、求广义特征值、深度神经网络等优化问题的张量分解方法,如张量列车和分层 Tuck 分解,并通过图形方法以及基于核张量的低秩张量近似来解释张量网络是如何能够在大量数据上执行分布式计算的。
Aug, 2017
本文介绍了 SaMbaTen 算法,一种用于处理动态演化的多模态数据集的增量张量分解技术,能够在简化空间中有效地汇总现有张量数据及其增量更新,并且在精度方面具有与非增量技术相当的结果,速度快 25-30 倍,并且可以处理最大维度达到 100K x 100K x 100K 的稠密张量。
Sep, 2017
该论文从大数据分析的角度,提出了近期在Tensor补全算法方面的多项发展,包括Tensor补全算法、附加信息的Tensor补全算法、可伸缩的Tensor补完算法和动态Tensor补全算法。此外,论文总结了Tensor补全算法在现实世界数据驱动问题中的应用和常见的实验框架,并展望了未来在此领域的挑战和研究方向。
Nov, 2017
本文将全面介绍张量(Tensors)的概念和分解方法,并探讨它们在机器学习中的应用,特别是在无监督学习和多关系数据分析等领域的优越性,同时结合实例研究了张量估计混合模型的基本方法,并提供了相关软件类库的参考。
Nov, 2017
本文提出了一个高效的 Multi-resolution Tensor Completion Model (MTC) 来解决张量部分观测值的补全问题,该模型实现了张量模式特性的探索,并利用分辨率层次进行递归优化。在两个 COVID-19 相关的时空张量上的实验证明,MTC 可以在仅有 5% 细颗粒观测情况下提供达到 65.20% 和 75.79% 的适配度 (PoF),相对于最佳基线的相对改进为 27.96%。
Jun, 2021
回归分析是数据分析和机器学习领域的关键研究领域之一,它致力于探索变量之间的依赖关系,通常使用向量进行表示。高维数据的出现带来了传统数据表示方法的挑战,而张量作为向量的高维扩展,被认为是高维数据的自然表示。本书对基于张量的回归模型及其应用进行了系统研究和分析,涵盖了已有的方法和理论特性,读者可以了解如何使用这些方法解决多维数据的回归任务以及可用的数据集和软件资源。
Aug, 2023
我们提出了一种多字典张量分解(MDTD)框架,利用编码字典中关于张量模式的先验结构信息来获得稀疏编码的张量因子。通过实验证明,MDTD相比无字典方法学习到更简洁的模型,且在重构质量、缺失值插补质量和张量秩的估计等方面均具有明显的改进,而且不会增加运行时间。
Sep, 2023
在本研究中,我们研究了嵌套矩阵-张量模型中隐藏的嵌入信号的估计,该模型是经过拓展的经典脉冲秩一张量模型,其动机来源于多视图聚类。我们量化了在通过计算观测张量数据的展开的最佳秩一(矩阵)近似而不是寻找最佳秩一近似的情况下这两种方法之间的性能差距,特别是通过推导出展开方法的精确算法门限并展示其呈现BBP类型的转换行为。因此,这项工作与最近的研究成果相一致,深化了我们对为什么张量方法优于矩阵方法处理结构化张量数据的理解。
Feb, 2024
本文提出了一种名为Dynamic Multi-network Mining(DMM)的新方法,用于将张量时间序列转化为一组具有多种长度(即聚类)的段群,并结合l1-norm的依赖网络对其进行子序列聚类,以实现可解释性、准确性和可扩展性,并通过实验验证了其在聚类准确性方面优于现有方法。
Feb, 2024