基于运动 GAN 的视频代理行为迁移

NIPSNov, 2017

基于运动 GAN 的视频代理行为迁移

Transferring Agent Behaviors from Videos via Motion GANs

Ashley D. Edwards, Charles L. Isbell Jr

TL;DR使用生成对抗网络训练短期子目标，从而在未知环境中生成视觉上有意义的行为，并使用这些行动来训练强化学习代理。

Abstract

A major bottleneck for developing general reinforcement learning agents is determining rewards that will yield desirable behaviors under various circumstances. We introduce a general mechanism for automatically specifying meaningful behaviors from raw pixels. In particular, we train a

reinforcement learning generative adversarial network sub-goals motion templates training

发现论文，激发创造

通过对抗性模仿从动作捕捉学习人类行为

本文介绍应用生成对抗性模仿学习方法，通过有限的高维仿人体运动演示数据，训练神经网络策略以产生类人的运动模式，并利用该方法构建子技能策略解决高维身体姿态控制任务。

Jul, 2017

基于 3D 约束和细节增强的人体动作迁移

使用生成对抗网络，将源角色的动作转移到目标角色上，并且保持高逼真度。将姿势信息和外貌信息解耦并重新组合，利用重建的三维人体模型作为 GAN 的条件，进一步引入细节增强网络以增强转移结果的细节信息。实验表明，该方法在质量和数量上均优于现有技术。

Mar, 2020

强化学习任务状态对应关系的学习，用于知识迁移

该研究提出了一种基于生成对抗网络模型的一对一转移学习方法，旨在解决深度强化学习中新任务的知识重用和泛化问题。

Sep, 2022

社交 GAN：具有生成对抗网络的社交可接受行迹

通过将序列预测和生成对抗网络的工具相结合，我们成功地解决了自动移动平台中的人体运动行为预测问题，并在准确性，多样性，碰撞避免和计算复杂性方面胜过了以往的工作。

Mar, 2018

通过强化学习控制 GAN 的潜在空间：基于任务的图像到图像翻译案例研究

通过将强化学习（RL）代理与潜在空间生成对抗网络（l-GAN）相结合，我们提出了一种新的方法来解决 GAN 生成过程中控制的挑战。我们开发了一个具备精心设计的奖励策略的 actor-critic RL 代理，使其能够在 l-GAN 的潜在空间中导航并根据指定任务生成输出，通过使用 MNIST 数据集进行了一系列实验证明了我们方法的有效性。我们首次将 RL 代理与 GAN 模型集成，具有极大的潜力来增强生成网络。

Jul, 2023

基于生成对抗网络的人脸转换

提出了一种基于生成对抗网络的端到端人脸转移方法，使用 CycleGAN 生成目标角色的面部图像并探究了 PatchGAN 以及不同感受野大小对生成图像的影响。

Oct, 2017

学习使用 GameGAN 模拟动态环境

本文介绍了 GameGAN 这个生成模型，它通过学习代理与环境交互中的表现来模拟图形游戏环境，并通过内部环境地图和动静分离的方式实现更高的可解释性和更广泛的应用。

May, 2020

基于对抗学习的互动感知多智能体跟踪和概率行为预测

使用对抗生成网络 (GAN) 提出一个通用的多智能体概率预测和跟踪框架，可以更好的对多个实体之间的交互行为进行预测，并在实际车辆行为预测中取得了比传统监督学习更好的性能。

Apr, 2019

通过观测映射和行为克隆的少样本策略转移框架

通过观察映射和行为克隆，本文提出了一个针对两个领域的少样本策略传递框架，利用生成对抗网络（GANs）和循环一致性损失将源领域和目标领域之间的观察映射，并将获取的映射用于将成功的源任务行为策略克隆到目标领域，进而实现有限目标任务交互情况下和源领域与目标领域在语义上不相似的情况下的成功行为策略传递。

Oct, 2023

动态转移 GAN: 通过从源视频传输任意时间动态到单个目标图像来生成视频

提出了一种新的基于生成对抗学习的方法 Dynamics Transfer GAN，用于生成空间时间连续且具有目标图像的视觉特征的视频序列。通过两个鉴别器对所生成的视频序列进行验证，实验结果表明该方法成功地将源视频序列的任意动态特征转移到了目标图像上，同时保持了目标图像的时空连贯性和外观。

Dec, 2017