掩码轨迹模型：预测、表征和控制

ICMLMay, 2023

掩码轨迹模型：预测、表征和控制

Masked Trajectory Models for Prediction, Representation, and Control

Philipp Wu, Arjun Majumdar, Kevin Stone, Yixin Lin, Igor Mordatch...

TL;DR本文介绍了遮盖轨迹模型 (MTM) 作为顺序决策制定的一般抽象。MTM 采取轨迹，如状态动作序列，并旨在在相同轨迹的随机子集的条件下重建轨迹。通过高度随机化的遮盖模式进行训练，MTM 学习多功能网络，可以通过在推理时选择适当的遮罩来扮演不同的角色或具有不同的能力。通过在几个连续控制任务中进行广泛的实验，我们展示了相同的 MTM 网络可以匹配或优于专门针对前述能力进行训练的网络。此外，我们发现 MTM 学到的状态表示可以显着加速传统 RL 算法的学习速度。最后，在离线 RL 基准测试中，我们发现 MTM 尽管是一种通用的自监督学习方法，并且没有任何明确的 RL 组件，但它与专门的离线 RL 算法相竞争。

Abstract

We introduce masked trajectory models (MTM) as a generic abstraction for sequential decision making. MTM takes a trajectory, such as a state-action sequence, and aims to reconstruct the trajectory conditioned on

masked trajectory models sequential decision making forward dynamics model inverse dynamics model offline rl agent

发现论文，激发创造

RePreM: 用带掩码模型的表示预训练进行强化学习

通过使用遮蔽模型进行预训练，提出了适用于 RL 的遮蔽模型预训练方法 RePreM，避免了算法复杂性和数据增强的问题，并通过各种任务的实验证明了其有效性。

Mar, 2023

UniMASK: 顺序决策问题中的统一推理

本研究介绍了一种名为 UniMASK 的框架，利用序列掩蔽的方式，提供了一种统一的方式来指定可以用于多种不同序列决策任务的模型。经过微调后，我们的 UniMASK 模型能够在许多任务上表现非常好，甚至比单任务模型表现更好。

Nov, 2022

高尔夫球员：带掩码目标条件的 MnM 网络轨迹预测

本研究提出了一种名为 golfer 的基于 Transformers 的模型，能够高效地预测自动驾驶汽车的轨迹，并在 2022 Waymo Open Dataset Motion Prediction Challenge 中获得第二名和 minADE 中的第一名。

Jul, 2022

RMP: 一种用于运动预测的随机遮罩预训练框架

在本研究中，我们提出了一个预训练框架，以形式化交通参与者轨迹预测的预训练任务，通过改变掩码配置文件，我们的框架可以轻松切换多个与运动相关的任务，通过在 Argoverse 和 NuScenes 数据集上的评估，我们展示了我们提出的预训练框架能够处理嘈杂的输入，提高了运动预测的准确性和遗漏率，尤其适用于随时间遮挡的物体。

Sep, 2023

基于掩码自编码的可扩展通用决策制定

本文提出了一种名为 MaskDP 的简单、可扩展的自监督预训练方法，用于强化学习和行为克隆。这种方法利用了掩码自编码器（MAE）在状态 - 动作轨迹中的作用，可以更好地学习多个下游任务的模型。实验表明，MaskDP 模型的零 - shot 迁移和有前途的规模化行为与模型大小有关。

Nov, 2022

T4P：通过遮蔽自动编码器和特定角色记忆的测试时轨迹预测训练

使用数据驱动方法结合在线学习方法（包括使用自动标签任务的回归损失和使用隐式自编码器进行表示学习）来解决轨迹预测中的多个参与者和环境交互问题，并在各种跨数据集分布转移场景中验证了方法的有效性。

Mar, 2024

多智能体决策的屏蔽预训练

提出了一种基于 Transformer 架构的 MaskMA 预训练框架，通过分布式执行和部分观察的方式，同时解决了多智能体决策中分布式预训练和执行不匹配以及智能体数量和行动空间多样性的问题，实验结果显示 MaskMA 在多个任务上都表现出色，包括 77.8％的零 - shot 胜率和有效的策略协作和临时团队游戏能力。

Oct, 2023

面具化运动预测器是强大的三维动作表示学习器

本文提出了一种用于 3D 动作识别的 Masked Motion Prediction（MAMP）框架，通过对蒙面的空间 - 时间骨骼序列进行预测，实现对丰富语义区域的更好关注，进而提高自监督预训练的性能。经过对 NTU-60、NTU-120 和 PKU-MMD 数据集的广泛实验，表明所提出的 MAMP 预训练方法显著提高了基础的 transformer 模型的性能，并取得了最先进的结果。MAMP 的源代码可以在给定的网址上找到。

Aug, 2023

HiMTM: 面向长期预测的分层多尺度遮蔽时间序列建模

通过使用多尺度层次掩蔽时间序列建模方法，HiMTM 在提升多尺度特征提取能力的同时，通过实验证明其在时间序列预测准确性上具有明显优势，并在天然气需求预测领域得到了有效应用。

Jan, 2024

自监督视频表示学习的掩模运动编码

提出了一种名为 MME 的预训练模型，旨在通过重建外观和运动信息来探索时序线索，从而改善视频表示性能。方法着重解决多帧间的长期运动和从稀疏视频中获取细粒度时序线索这两个关键问题，并通过重建模糊区域中代表位置和形状变化的运动轨迹，使预训练模型进一步预测运动细节。

Oct, 2022