本文介绍了现有的图形数据增强方法,并对文献进行了结构化概括。从数据、任务和学习的角度,我们首先介绍了三种不同的分类图形数据增强方法的方法。然后,我们介绍了不同方法和应用的最新进展,并总结了一些未解决的挑战和未来研究的方向。
Feb, 2022
本文介绍了一个名为 GAug 的图数据增强框架,并讨论了在图形神经网络 (GNN) 上进行数据增强的实际动机、考虑因素和策略,重点介绍了如何通过神经边缘预测器有效地提高节点分类性能。实验结果表明,通过 GAug 的数据增强可以提高 GNN 的性能,适用于多种基准数据集和架构。
Jun, 2020
本文系统地综述了不同的图像数据增强方法,提出了分类学,分析了这些方法的优点和局限性,以及在三个典型的计算机视觉任务上所做的大量实验,包括语义分割,图像分类和物体检测。最后,我们讨论了数据增强面临的挑战以及未来的研究方向,以提出一些有用的研究指导。
Apr, 2022
本文提出了 GraphAug,一种自动化的数据增强方法,通过采用基于强化学习的训练方法最大化预测的标签不变概率,可以在大多数时候产生标签不变性数据增强,并在不同的图分类任务中优于以前的图增强方法。
本综述论文简要概述了关于图数据增强和小样本学习的最新研究,涵盖了包括节点和边的扰动、图粗化和图生成在内的图数据增强技术,以及元学习和模型无关元学习等小样本学习的最新发展。该论文深入探讨了这些领域,并进一步对其进行细分分类,同时还概述了基于规则的方法和基于学习的方法在图增强技术下的调查结果。针对图上的小样本学习,也研究了度量学习技术和基于优化的技术。总的来说,本论文提供了广泛的技术组合,可用于解决低数据情况下的图处理问题。
Nov, 2023
本文为了指导未来的研究者,系统地回顾了基于深度生成模型的时间序列数据生成算法,并提出了最相关的研究分类学,同时对算法的性能和评估进行了分析。
Jun, 2022
该篇研究提出了两种启发式算法:随机映射和基元相似度映射,并结合数据增强、数据筛选和模型重训练的通用模型演化框架 M-Evolve 以优化预训练的图分类器,解决小规模基准数据集上过拟合问题,平均提高 3-12% 图分类任务的准确率。
Sep, 2020
人工智能发展历史中,高质量数据对各种深度学习模型的影响显著。最近,与基于模型的方法相比,AI 社区的关注重点转向了基于数据的方法,即更好地处理数据以增强神经模型的能力。这项调查从数据为中心的角度全面回顾了图学习方法,并旨在回答两个关键问题:(1)何时修改图数据和(2)如何修改图数据以发掘各种图模型的潜力。我们提出了一个基于图学习流程阶段的新分类法,并强调了处理图数据中不同数据结构(如拓扑、特征和标签)的方法。此外,我们分析了嵌入图数据中的一些潜在问题,并讨论了如何以数据为中心的方式来解决它们。最后,我们提供了一些关于数据为中心的图学习未来发展方向的前景。
Oct, 2023
本篇研究探讨使用数据增强方法,如 mixup 和 syntax-breaking,对于用于源代码语言的训练数据的质量提升,结果表明这些方法可以产生更准确和稳健的模型。
Mar, 2023
本论文调研了时间序列数据增强技术及其在神经网络时间序列分类中的应用,其中提出了四种基于变换、模式混合、生成模型和分解方法的方法, 并在 128 个时间序列分类数据集上使用六种不同类型的神经网络对 12 种时间序列数据增强方法进行了实证评估,以分析每种数据增强方法的特点、优缺点和建议,并旨在帮助选择神经网络应用的时间序列数据增强方法
Jul, 2020