MaDi：学习遮蔽干扰项以实现视觉深度强化学习的泛化能力

Dec, 2023

MaDi：学习遮蔽干扰项以实现视觉深度强化学习的泛化能力

MaDi: Learning to Mask Distractions for Generalization in Visual Deep Reinforcement Learning

Bram Grooten, Tristan Tomilin, Gautham Vasan, Matthew E. Taylor, A. Rupam Mahmood...

TL;DRMaDi 是一种基于奖励信号学习屏蔽干扰的算法，通过使用一个轻量级的神经网络生成动态的遮罩，让深度强化学习代理能够集中学习任务，从而改善了代理的焦点和泛化能力。

Abstract

The visual world provides an abundance of information, but many input pixels received by agents often contain distracting stimuli. autonomous agents need the ability to distinguish useful information from task-irrelevant perceptions, enabling them to generalize to unseen environments w

distractions autonomous agents madi masking generalization

发现论文，激发创造

一个高效的通用化视觉动作策略框架：基于控制感知增强和特权引导蒸馏

通过数据增强来解决在学习高维视觉观察中适应新环境及复杂视觉变化所面临的泛化问题，提出了学习控制感知掩码的方法以及通过预先训练的强化学习专家将知识传输给学生视觉动作策略来解决训练不稳定性问题。

Jan, 2024

基于掩膜图像训练的通用深度图像去噪技术

本文提出了一种蒙版训练的方法，通过遮盖输入图像的随机像素并在训练期间重建丢失的信息，同时遮盖自注意力层中的特征以避免训练 - 测试不一致性的影响，从而提高了去噪网络的泛化能力。

Mar, 2023

MagDR: 基于掩码引导的检测和重建技术用于深度伪造防御

本文提出了一个名为 MagDR 的方案，该方案基于掩码引导检测和重建流程，以对抗 Deepfakes 的对抗攻击。利用检测模块来定义 Deepfakes 的输出异常性，提取适应性掩码来捕获局部面部区域的变化，并通过学习重构流程实现防御。MagDR 在防御黑盒和白盒攻击方面表现出有希望的性能。

Mar, 2021

掩蔽自动编解码器是一种有效的多任务视觉通才

通过引入双向注意力机制、并行解码框架和掩码序列建模方法，设计了一种名为 MAD 的多任务视觉通用模型，用于统一各种视觉任务，实验证明 MAD 在性能和推理效率方面优于自回归模型，并在与任务专用模型相比获得竞争力的准确性。

Mar, 2024

通过可微分掩码和共同注意力蒸馏学习图像翻译的高效 GAN

本研究提出了一种新颖的 GAN 压缩方法 DMAD，通过使用可微分的掩模和协同注意力熔炼来搜索轻量级发生器体系结构，同时从预训练模型的生成器和判别器中提取有用的注意力图，成功稳定轻量级模型的对抗训练，而在保持可比余白性能的前提下，DMAD 能够将 CycleGAN 的 MACs 降低 13 倍，Pix2Pix 的 MACs 降低 4 倍。

Nov, 2020

面具世界模型的视觉控制

通过自编码器和动态学习的分离以及辅助奖励预测目标的引入，提出了一种新的视觉模型 RL 框架，取得了 Meta-world 和 RLBench 的 50 项任务中，81.7% 的成功率的表现。

Jun, 2022

分心控制套件 - 基于像素的强化学习的挑战性基准测试

本文提出一种基于视觉的控制新的挑战性基准，用于分析在多种视觉干扰和复杂性环境下的强化学习算法，结果表明当前视觉控制强化学习方法在复杂性视觉干扰下表现不佳，需要新的方法来应对现实世界的视觉复杂性。

Jan, 2021

领域对抗性强化学习

该研究解决强化学习中的泛化问题，通过领域对抗优化过程实现学习表征的视觉不变性，取得显著的泛化改进效果。

Feb, 2021

多智能体决策的屏蔽预训练

提出了一种基于 Transformer 架构的 MaskMA 预训练框架，通过分布式执行和部分观察的方式，同时解决了多智能体决策中分布式预训练和执行不匹配以及智能体数量和行动空间多样性的问题，实验结果显示 MaskMA 在多个任务上都表现出色，包括 77.8％的零 - shot 胜率和有效的策略协作和临时团队游戏能力。

Oct, 2023

深度强化注意力学习用于品质感知视觉识别

通过在任何卷积神经网络的弱监督生成中间注意力图的机制上进行改进，揭示了注意力模块的有效性，提出了一种元质疑网络，并结合强化学习的方法进行优化，从而提高了注意力模块的表达能力，并在分类和实例识别基准测试上进行了广泛的实验验证。

Jul, 2020