局部分解动态的反事实数据增强

Jul, 2020

Counterfactual Data Augmentation using Locally Factored Dynamics

Silviu Pitis, Elliot Creager, Animesh Garg

TL;DR本文介绍了一种利用局部因果模型（local causal models，LCMs）、逆因数据增强（Counterfactual Data Augmentation，CoDA）等方法来提高强化学习（reinforcement learning，RL）算法采样效率的方法。实验表明，在其所擅长的分解式任务中，该方法能显著提高算法的表现。

Abstract

Many dynamic processes, including common scenarios in robotic control and reinforcement learning (RL), involve a set of interacting subprocesses. Though the subprocesses are not independent, their interactions are often sparse, and the dynamics at any given time step can often be decom

local causal models reinforcement learning counterfactual data augmentation sample efficiency causal structures

发现论文，激发创造

MoCoDA: 基于模型的反事实数据增强

本文提出一种利用局部分解结构的动力学模型、试验数据增强等方法的强化学习算法，该算法在离线学习方面比标准算法可显著提升其在超出分布范围的机器人操作任务中的性能表现。

Oct, 2022

基于反事实数据增强的高效强化学习

该研究提出一种数据效率的强化学习算法，利用结构因果模型来进行状态动态建模，从而实现反事实推理以及避免因数据不足带来的偏见问题。该算法对于少样本数据情况下的个体级政策学习有较好效果。

Dec, 2020

基于因果结构的文本 OOD 泛化的增强

通过使用反事实数据增强、基于数据的因果结构模拟对虚假特征的干预，以及采用大型语言模型来表示文本的条件概率，该论文介绍了一种改善文本分类器鲁棒性的方法，并通过在医疗叙述和半合成数据上进行广泛实验，证明了该方法对改善模型的预测能力具有积极效果。

Oct, 2023

深度神经网络的隐式反事实数据增强

本文提供了一种名为 ICDA 的隐式反事实数据增强方法，通过生成具有不同扩展强度的深度特征来打破假象的关联，并从正则化方面解释了这种方法，结果表明我们的方法在许多需要越区域概括的典型学习场景上始终提高了流行深度网络的泛化性能。

Apr, 2023

因果作用感知的反事实数据增强

离线数据是教导机器人复杂行为的宝贵和实用资源。本文介绍了一种数据增广方法 CAIAC，可以在没有访问在线环境交互的情况下，从一个固定的数据集中创建可行的合成转换。通过利用量化因果影响的原则方法，我们能够通过在数据集中独立轨迹之间交换 “不受动作影响” 的状态空间部分来进行反事实推理。经验证明，这可以显著提高离线学习算法对分布偏移的鲁棒性。

May, 2024

CATfOOD：提升跨领域性能和校准性的反事实增强训练

使用大型语言模型对小型语言模型进行训练数据增强，在抽取式问答系统中改善模型的领域外性能，并提高模型校准的多样性和精简性。

Sep, 2023

通过主动生成成对的反事实，提高分类器的健壮性

本文提出一种利用对抗生成模型自动生成对抗样本并用成对分类器对其自动标注的框架，通过对仅 10% 人工标注的对抗样本数据进行生成，能有效提高情感分类和问题重述任务等自然语言分类器的 18-20% 稳健性和 14-21% 误差缩减。

May, 2023

通过上下文感知的动态模型实现对新物理系统的泛化

提出了一种新的框架 CoDA，旨在解决数据驱动模拟物理系统无法泛化到共享相同一般动态的新系统的问题，该框架结合了上下文信息的动态调整和超网络，实现了快速的适应和更好的泛化性能。

Feb, 2022

CORE: 一种用于生成对事实对照数据的检索 - 编辑框架

通过 COunterfactual Generation via Retrieval and Editing (CORE) 框架，在训练过程中利用检索和编辑技术生成多样化的抗干扰扰动（即 counterfactual），从而显著提高了模型的泛化能力。与其他数据增广方法相比，CORE 抗干扰扰动在改善模型对分布外（OOD）数据的性能方面表现更出色。

Oct, 2022

DISCO: 利用大型语言模型提取短语反事实

该论文提出了一种名为 DISCO 的新框架，可以使用大规模语言模型生成高质量的反事实数据，并借助特定于任务的老师模型过滤生成，以提高模型的稳健性和泛化性能。实验结果表明，使用这种方式进行学习，学生模型的鲁棒性和跨分布能力比基线提高了 6%（绝对）和 5%。

Dec, 2022