Signature Kernel 是一个用于顺序数据的正定核函数。介绍了该核函数的基本知识及理论性质,同时强调其在计算上的高效性及实证性能。
May, 2023
张量代数提供了一种针对任意长度序列的相似性度量中最强大的一种方法,即具有概率分析中有吸引力的理论保证的签名核,本研究针对这严重的计算瓶颈,提出了一种在序列的非欧几里得领域上进行签名核加速的基于随机傅里叶特征的方法,并且证明了所提出无偏估计器的均匀逼近保证,同时保持其在序列长度和数量上的计算为线性,此外,结合张量投影的最新进展,我们得到了两个更可扩展的时间序列特征,具有有利的集中性质和在时间和内存上的计算复杂度,实证结果表明,计算成本的降低在中等规模数据集上几乎没有影响准确性,并且使得我们能够处理高达一百万种时间序列的大型数据集。
Nov, 2023
应用机器学习于生物序列 ——DNA、RNA 和蛋白质 —— 具有巨大的潜力推进人类的健康、环境可持续性和基础生物学的理解。因此,本研究旨在探讨这一问题领域中的挑战并提供修改现有基于核的机器学习方法以确保其准确性和可靠性的简单有效的方式。
Apr, 2023
使用贝叶斯方法和高斯过程,结合符号核、稀疏变分方法等技术对序列数据进行学习,可以使得不同长度的序列可比较且利用奇异分析的强大理论结果;我们还介绍了一种使用引导张量处理未能有利的序列结构方法,将该方法和 LSTMs、GRUs 等结合起来,以建立利用优势的大型模型,并在多元时间序列分类数据集上进行基准测试。
Jun, 2019
本文提出了一种新的核函数族,用于处理时间序列数据(尤其是语音数据),该方法借鉴了动态时间规整(Dynamic Time Warping)的基本操作,并采用动态规划技术来计算最优序列,该核函数是正定的,并且在语音识别任务中表现出令人鼓舞的结果。
Oct, 2006
通过基于序列和图等组合结构的核来获得适当的神经操作,引入了一类深度循环神经操作并形式化表征其关联的核空间;在语言建模和分子图回归等标准应用程序上进行了实证评估,取得了这些应用程序的最新成果。
May, 2017
使用全局字符串内核通过随机特征映射来维护正定性并避免对角线支配的内核矩阵,具有与字符串长度和训练字符串样本数量的线性训练成本。
Nov, 2019
提出了 GP-LSTM 模型,利用可闭合表达式内核,在保留高斯过程非参数概率优势的同时,完全包含了 LSTM 递归神经网络的归纳偏置,能够很好地用于处理序列数据,提升了自动驾驶等领域的预测准确性。
Oct, 2016
本文提出一种新的卷积神经网络架构,通过将卷积核建模为连续函数,解决了传统神经网络处理序列数据时的梯度爆炸、记忆短视、非定长序列等问题,并在多个数据集上获得了最先进的结果。
Feb, 2021
该论文介绍了一种基于随机卷积结构的时间序列聚类方法,通过自动化特征提取技术和聚类算法对时间序列进行分类,从而在时间序列聚类基准测试中取得了优异结果。