ARDuP：Active Region 视频扩散技术的通用策略

Jun, 2024

ARDuP：Active Region 视频扩散技术的通用策略

ARDuP: Active Region Video Diffusion for Universal Policies

Shuaiyi Huang, Mara Levy, Zhenyu Jiang, Anima Anandkumar, Yuke Zhu...

TL;DR基于文本定义目标的视频规划器生成未来帧以可视化计划行动，从而导出控制行动，本文介绍了一种名为 ARDuP （Active Region Video Diffusion for Universal Policies）的视频策略学习框架，通过强调生成活动区域来增强条件策略对任务执行所需的交互区域的关注，在视频规划中结合活动区域的特性与潜在扩散模型，并在反向动态建模过程中利用潜在表示进行直接解码的行动，通过利用视频中的运动线索自动发现活动区域，本方法消除了对活动区域的手动注释需求，通过在模拟器 CLIPort 和真实世界数据集 BridgeData v2 上进行大量实验证明了 ARDuP 的有效性，取得了显著的成功率改善，并生成令人信服的逼真视频规划。

Abstract

sequential decision-making can be formulated as a text-conditioned video generation problem, where a video planner, guided by a text-defined goal, generates future frames visualizing planned actions, from which control actions are subsequently derived. In this work, we introduce Active

sequential decision-making video generation active region video diffusion policy learning latent diffusion models

发现论文，激发创造

教学视频中的过程规划：PDPP 算法

研究了指导视频中的过程规划问题，使用扩散模型进行分布拟合，从中采样操作序列达到规划目标，并在三个数据集上验证了其优于当前方法的性能表现。

Mar, 2023

高分辨率视频的时间一致性扩展扩散模型

通过文本引导的潜在扩散框架，实现视频升尺度，并在保持时域一致性和质量平衡之间提供更大灵活性。

Dec, 2023

ART・V: 基于扩散模型的自回归文本到视频生成

ART・V 是一个高效的自回归视频生成框架，使用扩散模型逐帧生成视频，并通过简化连续帧之间的运动来避免建模复杂的远程运动，同时保留预训练图像扩散模型的高保真生成能力。通过结合文本、图像等多种提示，ART・V 可以生成任意长度的视频，具有高度的多功能性和灵活性。通过引入掩蔽扩散模型和使用初始帧作为条件，ART・V 进一步提升了生成一致性和生成的视觉质量，能够在短时间内生成带有自然运动、丰富细节和高美感的视频，并支持多个文本提示组合成长视频的应用。

Nov, 2023

层次扩散策略对运动学感知多任务机器人操作

介绍了一种名为 Hierarchical Diffusion Policy (HDP) 的多任务机器人操作策略，包括分层结构、任务规划、运动轨迹和运动规划中的运动学感知控制。实验证明，HDP 在模拟和实际环境中的成功率显著高于现有方法。

Mar, 2024

通过文本引导的视频生成学习通用策略

通过将序列化决策问题转化为文本条件下的视频生成问题，我们能够推广到新的目标并在不同的环境下进行学习和泛化，从而建立更加通用的智能体。

Jan, 2023

2022 行动识别无监督领域自适应挑战赛: HNU-FPV 队技术报告

本研究介绍了一种利用信息图像区域来实现有效领域对齐的方法，并在 2022 EPIC-Kitchens 无监督领域适应（UDA）挑战中取得了第四名的成绩。该方法使用轻量级 CNN 提取输入双流视频帧的全局信息，并通过 One Shot 内容选择方法选择有信息量的图像块来进行特征对齐。

Jul, 2022

UPDeT：基于 Transformer 的策略解耦通用多智能体强化学习

本文提出了一种称为 Universal Policy Decoupling Transformer (UPDeT) 的 transformer-based 模型，可插入任何多智能体强化学习管道并具备强大的泛化能力，证明了相对于现有方法具有优异的迁移能力，在大规模 SMAC 多智能体竞争游戏中取得了显著的表现和训练速度（快 10 倍）。

Jan, 2021

基于数据驱动的时空交通服务管理区域生成框架

本文提出了一种基于数据驱动和多目标优化的区域生成框架 RegionGen，可为服务操作指定具有良好空间语义和可预测性的区域。实验结果表明，RegionGen 可为时空服务管理生成更适用的区域。

Jun, 2023

量化先于选择：活跃动态偏好在强化学习中的鲁棒性

通过引入主动动态偏好方法（Active Dynamics Preference），对系统随机参数进行有效选择，并在四个机器人运动任务中进行验证，表明此方法具有超强的适应性和鲁棒性，可有效提高机器人环境下的一致性。

Sep, 2022

学习语义感知动态视频预测

该研究提出了一种架构和训练方案，通过显式地建模去除和捕捉视频中语义一致的区域的演变来预测视频帧。

Apr, 2021