- GRIP: 使用潜在一致性和空间线索生成交互姿态
通过在计算机图形学、计算机视觉和混合现实等应用中建模真实的手物体相互作用,本研究引入了一种名为 GRIP 的基于学习的方法,从而综合生成符合逻辑的手的运动。通过引入一种新的方法来保证运动的时间一致性并生成一致的交互动作,GRIP 生成了精确 - ICCV全球地图:任意形状城市布局生成
利用图注意力网络的自动建筑布局生成方法,支持任意道路网络,生成逼真的城市布局,并基于学习先验条件生成,相较先前的布局生成网络表现出卓越性能,为 28 个大城市生成不同建筑形状的布局。
- 基于姿态感知的身体部位灵活运动重定向注意力网络
提出了一种基于身体部位的柔性运动重定向框架,其在运动编码阶段引入了姿势感知注意网络(PAN),并使用特征池化构建每个身体部位的共享潜在空间,通过在运动解码阶段应用该框架,可以在更具挑战性的重定向情景中获得合理的结果。
- SimHaze:用于实际除雾的游戏引擎模拟数据
本文提出了一种基于计算机图形学的生成配对干净 - 有雾图像的方法,并利用这个方法生成 SimHaze,一个新的合成雾数据集,此数据集可以用于训练去雾模型。通过使用此数据集进行训练,最新的去雾模型的性能明显优于以前的去雾数据集。
- 使用合成脸部数据进行人脸识别
本研究利用合成数据和微调模型,在人脸识别领域取得了高精确度的成果,并研究表明模型的性能还受到脸部不同部位的影响。
- 神经辐射场:过去、现在和未来
本篇论文探讨了 Neural Radiance Fields(NeRFs)在 3D 计算机视觉、计算机图形学和机器学习等领域的应用,包括历史、研究进展、潜在应用和影响等方面,并对相关研究进行了分类总结。
- HumanMAC: 用于人体动作预测的遮挡运动补全技术
本文提出了一种基于去噪扩散的新框架,通过训练一个运动扩散模型来生成运动,然后通过去噪过程实现在观察到的运动条件下进行运动预测,并在现实任务中有效地实现了不同类别运动的切换,取得了良好的算法性能和结果。
- 3D-LatentMapper:三维形状的视角无关的单视图重建
本文提出了一种新的框架,利用 Vision Transformer(ViT)和联合图像 - 文本表示模型 CLIP 的中间潜空间,用于单视图重建,通过学习从 ViT 和 CLIP 提取的深度特征与基础 3D 生成模型的潜在空间之间的映射来揭 - 神经形变金字塔的非刚性点云配准
本文提出一种名为神经变形金字塔(NDP)的方法,通过分层的运动分解将非刚性运动表示为金字塔结构,具有多级非刚性运动分解以及 50 倍的速度提升,并在 4DMatch/4DLoMatch 基准测试中获得了先进的非刚性点云配准结果。
- StyleGAN-XL:将 StyleGAN 扩展到大规模多样化数据集
使用强大的神经网络先验和渐进增长策略,成功地在 ImageNet 上训练了最新的 StyleGAN3 生成器,创造了新的 StyleGAN-XL 模型,并在大规模图像合成方面取得最新的技术突破。
- 数字人类化身在虚拟共存中的应用调查
本文调查了构建和使用数字人类化身的不同方法并研究它们对交互式虚拟共存 (VCP) 环境的影响,我们基于应用程序和方法学对文献中的不同方法进行分类,并根据其应用,贡献和限制比较不同的组和策略。此外还讨论了除数字人类化身以外的其他类似方法在 V - IJCAI通过生成 3D 虚拟环境评估连续学习算法
本文提出利用 3D 虚拟环境,通过自动化生成具有逼真外观的充满生命力的动态场景,进而探索在逼真情境下基于持续学习的算法进行更新的可能性,并采用参数化描述实现对视觉输入流的可视化控制。
- 球面传输损失下的稀疏小针灯估计
本文介绍一种新的光照估计模型 NeedleLight,其中需要用到 needlets 来表示照明,并允许同时在频域和空间域进行照明估计。通过设计最优阈值函数来实现稀疏的 needlets,并利用基于最优输运理论的新型球形传输损失来指导对空间 - CVPR基于深度编码的实时视频化妆合成
本文介绍了一种反向计算机图形方法,通过学习将带有化妆的示例肖像图像映射到渲染参数空间的模型,从而实现从参考图像自动合成化妆。
- CVPRFunction4D:基于极稀疏消费级 RGBD 传感器的实时人体体积捕获
本文提出了一种结合时间体积融合和深度隐式函数的人体体积捕捉方法,该方法不仅可以实现高质量、连续的重建,而且可以生成包含几何细节和更加逼真的纹理结果的细节保留深度隐式函数,实验结果表明,该方法在稀疏视角、泛化能力、重建质量和运行效率方面优于现 - ScalarFlow: 一种大规模的真实世界标量输运流体数据集,用于计算机动画和机器学习
本文介绍了 ScalarFlow,这是第一个大规模真实烟雾柱重建数据集。我们提出了一个准确的物理基础重建框架,其中包括估计难以观测的流入区域和一种有效的规则化方法。我们的数据集包含复杂和自然的自然驱动流,并演变至湍流,并包含可观测的标量传输 - 从人类到模型角色的面部表情再现简化
本文提出了一种基于非线性表情嵌入和表情域翻译的跨域表情转移技术,通过低维潜空间、几何约束、感知约束和用户友好的技术,实现了人脸表情转移到虚拟角色上,并且在大范围实验和用户研究中证明了该方法的高效性和高质量。
- 3D 对抗性标志能否遮蔽人类?
本文介绍了一种新型的三维对抗性标志攻击方法,通过纹理映射构建任意形状的标志,通过可微分渲染反向传播到二维图像领域中,能够在攻击物理世界中欺骗最先进的深度物体检测器。
- Wasserstein 重心可以在固定维度的多项式时间内计算
使用计算几何技术有效地实现对应的分离神器来解决指数大小的线性规划问题,为任何固定维度的 Wasserstein barycenters 问题提供确定或高精确度计算的多项式时间算法。
- 神经渲染的现状
本文是对神经渲染发展趋势和应用的一篇最新综述,该技术结合了计算机图形学和深度生成模型,以生成可控、逼真的输出,包括新视图综合、语义照片操纵、人脸和身体再现、重新照明、自由视角视频以及用于虚拟和增强现实遥感的逼真头像的创建等方面。我们还讨论了