- 通过有条件的视图合成实现无监督的关节物体建模
通过使用第一次观测的隐式模型学习对象的几何和外观部分,并通过渲染第二次观测来蒸馏部分分割和关节运动,我们提出了一种新的无监督方法来学习刚性部分组成的关节对象的姿势和部分分割。此外,为了解决部分分割和关节运动的联合优化中的复杂性,我们提出了基 - 基于扩散的人体姿态和形状编辑
人物图像中的姿势和身体形状编辑一直受到越来越多的关注。然而,当前的方法在处理大幅度编辑时往往受到数据集偏见的困扰,导致逼真度和人物身份的退化。我们提出了一种一次性方法,可以实现大幅度编辑并保留身份信息。为了实现大幅度编辑,我们使用一个 3D - PoSE: 通过位置跳跃训练实现 LLMs 的高效上下文窗口扩展
本文介绍了 Positional Skip-wisE(PoSE)训练方法,用于将大型语言模型(LLMs)高效地适应于极长的上下文窗口。通过在训练过程中使用具有操作位置索引的固定上下文窗口来模拟长输入,PoSE 将训练长度与目标上下文窗口大小 - HandMIM:3D 手部网格估计的姿态感知自监督学习
提出了一种新颖的自监督预训练策略来回归 3D 手部网格参数,并在各种手部网格估计任务上取得了强大的性能。
- ICML利用行为特征进行车载行人轨迹预测
本文提出了一种行人轨迹预测的新方法,称为 BA-PTP,利用行人的行为特征,通过摄像头上获取的视觉观察进行预测。通过融合不同的输入流和注意机制,产生最终的嵌入表达,用于预测图像中的未来边界框。在两个行人行为预测数据集的实验中,论文展示了利用 - CVPR利用品种信息从图像中学习回归 3D 狗形状
该论文提出了一种名为 BARC 的新方法,该方法通过对犬种相似性的研究,解决了从单幅图像中恢复犬只 3D 形态和姿态的难题,证明了基因相似性的先验信息可以帮助弥补缺乏 3D 训练数据的不足。
- 单目视角下的人类图像综合的风格和姿态控制
本文提出了一种新方法,称为 StylePoseGAN,用于合成具有姿势和部位外观显式控制的照片真实感的人类图像,并能够将其用于虚拟换装、动作模仿和新视角合成等应用中。
- AAAI城市数据集增强的人造人偶技术
本文提出了一种数据增强方法 (DummyNet),通过对城市场景中的人的姿态、外貌和目标背景场景进行解缠,从而生成不同姿态、外貌、嵌入不同背景场景,具有足够多的人的图像数据集合。DummyNet 不仅在各种数据集上提高了现有行人检测器的性能 - 单目视频中行人动作的识别和三维定位
本论文旨在通过单目行人动作识别和以自我为中心的视角进行的 3D 定位,预测行人意图和行动轨迹,通过使用传统 JAAD 和 KITTI 数据集以及 H3D 驾驶数据集的定性测试,展示了所提出的行动识别框架和定位方法的有效性和优越性。
- CVPR关节感知规范表面映射
本文提出了一种学习图像中物体变换和规范表面映射关系的方法,通过强制一致性来获得监督信号,实验结果表明只使用前景掩码标签就可以学习得到更准确的规范表面映射预测和更有意义的物体变换。
- CVPRTailorNet:利用人体姿势,形状和服装风格预测 3D 服装模型
TailorNet 是一个用于预测三维服装变形的神经模型,它综合考虑了服装的姿态、形状和风格等因素,同时保留了皱纹细节。该模型采用了分解变形模型的方法,通过低频和高频组合预测服装形变,并且相比之前的模型,TailorNet 可以更快地提供更 - ICCV图像合成的无监督鲁棒性潜在特征分离
通过学习一个新的方法,深度生成模型可以不需要姿态注释便可学习到表征物体外观和姿态等属性的独立潜在特征,这些特征是可以解释的,且能够生成和修改图像。
- ICCV自监督学习的深度和运动在光度不一致下的训练
本文介绍了一种通过自监督学习获得单目序列深度和姿态的方法,该方法不需要基础数据的支持,增加了更强的几何量和时间图像序列内部一致性的约束条件,能够显著提高单目图像序列深度和相对姿态估计的性能。
- 飞行机器人的视觉惯性测距
本文介绍了如何通过使用摄像头和惯性测量单元来实现无人机的姿态和速度的估计,摄像头和惯性测量单元十分常见且价格低廉。
- 几何姿态可供性:带场景约束的三维人体姿态
通过使用基于视觉的场景几何形状信息,我们提出了一种用于改善人体姿态估计的新颖机制:多层深度图。我们展示了这种方法可以提高 3D 姿态估计的精度。
- 利用可变形 GAN 生成具有外貌和姿势条件的人类图像
本文提出了一种基于姿势和外貌信息生成人物图像的方法,使用带有 “可变形跳跃连接” 的生成对抗网络来解决像素对像素的错位,并使用最近邻损失来匹配生成图像中的细节与目标图像。实验结果表明,这种方法在人物再识别任务中具有很好的性能表现。
- Vid2Game: 从现实世界视频中提取可控角色
该研究介绍了一种使用可控模型和神经网络生成具有自定义运动控制、背景及外观的人物影像序列的方法,展示了该方法在多个舞蹈家和运动员视频中的高质量表现。
- ICCV每个人都跳舞
本文介绍一种简单的方法来实现 “像我这样做” 的运动转移:使用 “姿势” 作为中间表示,从源主体中提取姿势并应用学习的姿势到外观的映射来生成目标主体,并提供一个可靠的合成内容检测的取证工具和一个首个独一无二的开源视频数据集来进行训练和运动转 - CVPR基于姿态的人类图像生成的可变形 GANs
本文提出了一种基于 GAN、可变形跳跃连接和最近邻损失的方法,用于合成给定姿势下的人物图像,并在各项指标上取得了最先进的结果。
- 一种用对抗神经张量方法学习分离表示的方法
本文提出了一种无监督的深度学习方法来分离在野外拍摄的脸部图像中的多个潜在变化因素,其中多个潜在变化因素的乘法交互通过多线性(张量)结构明确地建模。该方法学习了面部表情和姿态的分离表示,可用于各种应用,包括面部编辑,以及三维面部重建和面部表情