时间序列领域中的数据增强技术:调查和分类
本文系统地回顾了多种用于时间序列数据的数据增强方法,并通过对它们的优点和局限性进行结构化的概述来比较它们的性能,包括在不同任务下的时间序列分类、异常检测和预测,并讨论并强调了五个未来的研究方向。
Feb, 2020
本论文调研了时间序列数据增强技术及其在神经网络时间序列分类中的应用,其中提出了四种基于变换、模式混合、生成模型和分解方法的方法, 并在 128 个时间序列分类数据集上使用六种不同类型的神经网络对 12 种时间序列数据增强方法进行了实证评估,以分析每种数据增强方法的特点、优缺点和建议,并旨在帮助选择神经网络应用的时间序列数据增强方法
Jul, 2020
研究了在时间序列的分类和回归问题中,使用不同的技术进行数据增强的方法,特别关注了使用扩散概率模型和元属性来生成合成数据的可行性,结果表明该方法在训练分类和回归模型时具有很高的实用性。
Dec, 2023
我们的研究探讨了数据增强对多变量时间序列模型性能的影响,重点关注 UCR 存档中的数据集。尽管这些数据集规模有限,但我们通过使用 Rocket 和 InceptionTime 模型,在 13 个数据集中有 10 个实现了分类准确度的提升。这突显了充足数据在训练有效模型中的重要作用,并与计算机视觉领域取得的进展相一致。我们的工作在创新的方式下将现有方法适应并应用于多变量时间序列分类领域。我们对这些技术的全面探索为解决时间序列分析中的数据稀缺性设立了新标准,强调多样化的增强策略对于发掘传统和深度学习模型的潜力至关重要。此外,通过细致分析和应用各种增强技术,我们证明了战略性的数据丰富可以提高模型准确度。这不仅为未来的时间序列分析研究确立了基准,还强调了在有限数据可用性情况下采用多样化增强方法以提高模型性能的重要性。
Jun, 2024
这篇研究提出了一种生成单变量时间序列合成样本的新方法,通过使用过采样技术创建合成时间序列观测来改善预测模型的准确性,并在实验中证明了该方法优于全局模型和本地模型,提供了更好的权衡。
Apr, 2024
对于时间序列分类中的数据增强技术进行了详细研究,包括对过去十年间超过百篇研究论文中六十种不同数据增强方法的全面评估,并提出了专为时间序列分类设计的创新分类法,同时针对数据特征给出了基于实验结果的准确和实用建议。
Oct, 2023
本文旨在提高机器学习分类系统的泛化能力,通过对数据进行转换的方式来人工创建训练数据,从而增强数据的多样性,该文章就在「文本分类」中,对数据增强方法及其应用目标做了详细概述与分类,最终针对相关领域,提出建设性思路方向。
Jul, 2021
这篇论文对合成数据增强技术进行了广泛评估,包括基于真实 3D 图形建模、神经风格迁移、差分神经渲染、生成对抗网络和变分自编码器等生成人工智能技术。对于每一种方法类别,我们关注重要的数据生成和增强技术、广泛的应用范围和具体的用例,以及现有限制和可能的解决方法。此外,我们总结了用于训练计算机视觉模型的常见合成数据集,强调主要特点、应用领域和支持的任务。最后,我们讨论了合成数据增强方法的有效性,并希望通过这篇详细的论文为读者提供必要的背景信息和深入了解现有方法及相关问题。
Mar, 2024
本文系统地研究了八种基本数据增强方法并应用于七个数据集和三个骨干网络,同时还尝试了应用更多最新的自动数据增强技术到生物行为时间序列数据。通过本文的研究,我们得出了一些指标,这些指标可以指导我们设计更有效的数据增强方法。
Oct, 2022
数据增强(DA)在计算机视觉(CV)和自然语言处理(NLP)领域被广泛采用以提高模型性能,然而在网络环境中,尤其是在流量分类(TC)任务中,数据增强一直存在问题。本文通过对 3 个 TC 数据集使用数据包时间序列作为输入表示,并考虑多种训练条件,基准测试了 18 种增强函数,结果显示(i)DA 可以获得以前未探索的优势,(ii)基于时间序列顺序和掩码的增强函数更适用于 TC,(iii)简单的潜在空间分析可以提供有关增强效果的线索。
Jan, 2024