- ICML音频与谱对准的混合方法
使用神经网络作为 Dynamic Time Warping (DTW) 方法的预处理步骤,可以生成鲁棒的、适应性强的自动音乐配准。
- 将不可比空间上的时间序列对齐
本文提出了一种基于 Gromov 得距离度量不可比较空间上的时间序列之间的距离的 Gromov dynamic time warping (GDTW) 方法,为解决传统 DTW 方法不能比较不同空间上的时间序列的问题提供了一种有效的解决方案 - 利用判别式 teacher 进行时间扭曲的神经网络时间序列数据增强
本文旨在解决时间序列分类数据集较小的问题,提出了一种基于动态时间规整的数据增强方法 guided warping,使用深度卷积神经网络和循环神经网络对 85 个时序数据集进行了评估。
- 使用动态时间规整进行指令条件导航的综合评估
本研究提出了一种新的度量方式 “normalized Dynamic Time Warping(nDTW)”,通过对 agent 的运动轨迹与参照路线的对比,较好地解决了以往评估方式的缺陷,该方法在各方面表现优异,且应用于强化学习导航智能体 - 动态时间规整的一般优化框架
本文使用优化问题的思想,采用动态规划的方法,提出一种名为 GDTW 的 Python 包,可以高效地对信号的时间对齐进行求解。
- 时间序列分类的迁移学习
本文探讨了如何将深度卷积神经网络用于时间序列分类任务,并提出了一种新的动态时间规整方法来指导迁移学习中的源数据集选择,结果表明迁移学习可以提高模型的准确性。
- NIPS使用序列自编码器从未标记的时间序列学习变形距离的自动变形
本研究提出了一种名为 Autowarp 的算法,它利用序列自编码器优化学习特定的度量准则来衡量不加标签的时间序列轨迹之间的相似性,并在实验中表现良好。
- 随机扭曲序列:一种用于时序嵌入的随机特征方法
本文研究了一类基于 Random Warping Series 特征嵌入的正定核方法,相比于其他基于 DTW 的方法,该方法不会受到 Gram 矩阵对角线支配和样本量二次计算复杂度的问题,并且自然地享有 Random Features 近似 - 使用多语言瓶颈特征进行 ASR-free CNN-DTW 关键词检测,适用于几乎零资源语言
本文介绍一种基于多语言瓶颈特征(BNFs)的零资源关键字识别方法,将短语音片段进行动态时间规整(DTW)对齐,并使用卷积神经网络(CNN)进行关键字识别,同时借鉴多种资源语言,提高 DTW-CNN 方法的准确性,为低资源语言关键字识别提供了 - 使用 DTW 和 CNN 进行快速 ASR 免费的几乎零资源关键词检测 —— 人道主义监控
本研究使用动态时间规整作为卷积神经网络关键词识别系统的训练监督技术,旨在利用少量带注释的语音语料,并结合大量未标记数据进行训练,从而在 UN 急需援助的非洲地区提供语音识别服务。结果表明,使用动态时间规整后的卷积神经网络系统,虽然不能达到动 - 使用鉴别性神经声学单词嵌入的示例查询搜索
使用神经模型将查询语音和数据库语音嵌入后进行最近邻搜索,相比模板式语音嵌入取得了更高的性能和运行效率。
- ICMLSoft-DTW: 一种可微分的时间序列损失函数
在这篇论文中,我们提出了一种基于动态时间规整(DTW)距离度量的可微学习损失函数,并利用软 DTW 来计算 DTW,该方法可用于平均时间序列和聚类时间序列,且在此任务中比现有基线表现更好。接着,我们通过最小化机器输出时间序列与基准标签的软 - shapeDTW: 形状动态时间规整
为解决全局 DTW 算法匹配不合理的问题,本文提出一种名为 shapeDTW 的改进算法,它根据点对点的局部结构信息来提高匹配的精度。当 shapeDTW 作为距离度量用于最近邻分类器时,它在 84 个 UCR 时间序列数据集的 64 个上 - 使用动态时间规整模板选择的多元时间序列分类,用于人类活动识别
本文提出了一种基于动态时间规整的模板选择方法,避免了复杂特征提取和领域知识,展示了该算法在模拟和真实智能手机数据上的预测能力。
- AAAI社交群体之间的思想流动追踪
本文提出了一种方法来建模词群之间的流动行为、识别不同用户群体之间词汇聚类的先导滞后关系,使用基于动态时间扭曲的改进 Bayesian 条件协整来学习不同群体词汇之间的联系,采用基于张量的技术将这些链接单词聚类到不同的簇(ideas)中并跟踪 - KDD足球队传球策略的自动提取
本文介绍了一种基于 Dynamic Time Warping 的方法,通过分析事件的重复序列来揭示球队的战术,并基于整个赛季的分析得出了保持球权的传球策略或反击,以及以团队为重点或以个人球员的能力为重点的传球风格等见解。
- 字符串问题和动态时间规整的二次条件下界
研究了字符串相似性度量的经典算法,探究了其在时间复杂度下限方面的限制,并引入了一个证明相似性度量二次时间难度的框架,进而证明了一个字符串问题在其困难时的时间复杂度下限。
- 利用 Mel 频率倒谱系数(MFCC)和动态时间规整(DTW)技术的语音识别算法
本文章探讨了数字处理语音信号和语音识别算法的重要性,介绍了特征提取和匹配的数字信号处理方法以及非参数模型和动态时间规整技术的优越性。
- 利用双通道动态时间规整下限实现更快的检索
本文提出了一种基于 LB Improved 相关思想的 Dynamic Time Warping 算法,相比于传统的 LB Keogh 方法,本方法能够更快速、准确地在时间序列中查找最近邻。
- 一种基于全局对齐的时间序列内核
本文提出了一种新的核函数族,用于处理时间序列数据(尤其是语音数据),该方法借鉴了动态时间规整(Dynamic Time Warping)的基本操作,并采用动态规划技术来计算最优序列,该核函数是正定的,并且在语音识别任务中表现出令人鼓舞的结果