地球观测中的数据增强：扩散模型方法

Jun, 2024

地球观测中的数据增强：扩散模型方法

Data Augmentation in Earth Observation: A Diffusion Model Approach

Tiago Sousa, Benoît Ries, Nicolas Guelfi

TL;DR通过集成扩散模型，我们提出了一种新的四阶段方法来改善数据扩增的多样性，通过使用元提示生成指令，运用通用视觉 - 语言模型生成丰富的标题，微调地球观测扩散模型，并迭代地进行数据扩增，从而提高地球观测影像的语义丰富性和多样性。

Abstract

The scarcity of high-quality earth observation (EO) imagery poses a significant challenge, despite its critical role in enabling precise analysis and informed decision-making across various sectors. This

earth observation scarcity artificial intelligence data augmentation diversity

发现论文，激发创造

扩散模型在有效数据增强中的应用

通过使用图像转图像的方法、以及预训练的文本到图像扩散模型将其参数化，解决了数据扩增过程中具有高级语义标注的动物种类等属性缺乏多样性的问题，并在少样本情境和杂草识别任务中得到实际应用。

Feb, 2023

地球观测应用中的扩散模型：从云去除到城市变化检测

利用扩散模型在地球观测数据方面带来的先进人工智能技术的进展，在新的情境中将具有很高的潜力。论文通过介绍一系列生成模型，并提出和分析三个应用案例，展示了基于扩散方法在卫星图像数据领域的潜力，即云去除和图像修复、用于变化检测任务的数据集生成以及城市重新规划。

Nov, 2023

图像数据增强的扩散模型进展：方法、模型、评估指标和未来研究方向综述

图像数据增强在计算机视觉任务中是一种重要的方法，它可以增强训练数据集的多样性和质量，从而提高机器学习模型在下游任务中的性能和鲁棒性。本研究对基于扩散模型的图像增强方法进行了系统、全面、深入的综述，涵盖了广泛的策略、任务和应用。具体而言，首先对扩散模型的基本原理、模型架构和训练策略进行了全面分析。随后，引入了相关图像增强方法的分类方法，重点介绍了语义操作、个性化和适应性以及特定应用增强任务的技术。然后，分析了性能评估方法和相应的评估指标。最后，讨论了当前领域面临的挑战和未来的研究方向。

Jul, 2024

利用语言进行图像的语义增强

通过利用生成的图像来增强现有数据集的技术，该论文探讨了各种有效的数据增强策略，以提高深度学习模型的跨域泛化能力。

Apr, 2024

扩增模型与检索中的数据增强视角

本文系统评估了扩散模型生成图像的现有方法，并研究了新的扩展方式以评估它们对数据增强的益处。作者发现，将扩散模型个性化到目标数据的方法优于简单的提示策略，但使用扩散模型的训练数据，通过简单的最近邻检索程序，直接提高下游性能。此项研究揭示了扩散模型在数据增强方面的局限性，同时也突显了其在生成新训练数据方面的潜力，以提高在简单的下游视觉任务中的性能。

Apr, 2023

推动地球观测的人工智能：一种观点

本文介绍了地球观测所面临的机器学习等技术对于从原始数据到可用信息转化的必要工具和方法，并探讨了这些发展的挑战及其影响，包括计算机视觉、机器学习、高级处理和计算、以知识为基础的人工智能、可解释的人工智能和因果推断、物理感知模型、以用户为中心的方法以及与大规模使用机器学习技术相关的伦理和社会问题的讨论。

May, 2023

DreamDA: 用扩散模型进行生成型数据增强

该论文提出了一个新的基于扩散模型的分类导向框架 DreamDA，通过考虑训练图像中的原始数据作为种子并扰动其反扩散过程，DreamDA 生成符合原始数据分布的多样样本，并引入自训练范式生成伪标签和使用合成数据训练分类器，在四个任务和五个数据集上进行的广泛实验证明了 DreamDA 在合成高质量多样的图像并生成准确标签方面的有效性。

Mar, 2024

应用扩散模型进行图像字幕的多模态数据增强

本研究提出了一种基于多模态数据增强技术的图像字幕生成方法，旨在解决图像字幕对齐困难的问题。实验证明，本方法可以通过高质量生成图像 - 字幕对来扩充训练数据集，从而提高模型的训练效率和预测准确性。

May, 2023

地球观测应用模型预测中缺失数据的影响评估

地球观测应用中使用机器学习模型来处理复杂和异构的数据源，但是对于数据源的持久性可用性存在一种常见的假设。本研究评估了训练模型中缺失时间性和静态的观测数据源对于四个数据集中分类和回归任务的影响，并比较了不同方法的预测质量，发现其中一些方法对于缺失数据自然更具鲁棒性。特别是，集成策略实现了高达 100％的预测稳健性。我们发现，在回归任务中缺失情景比分类任务更具挑战性。最后，我们发现当光学视图单独缺失时，它是最关键的视图。

Mar, 2024

SatSynth: 针对航空语义分割的扩充图像 - 掩膜对的扩散模型

我们在地球观测任务中研究使用生成图像扩散来解决标注数据稀缺的问题，并发现生成的样本在提高卫星语义分割的定量性能方面取得了显著的改进。

Mar, 2024