- 具有模型先验的一次性隐式可动画化人形头像
ELICIT 是一种基于 3D 几何和视觉语义先验的模型,借助于 CLIP 模型以及基于分割的采样策略,可以从单张图片中生成逼真的、可动画的 3D 人体模型。
- TreeSketchNet: 从草图生成 3D 树模型参数
本文提出了一种使用基于卷积的深度神经网络架构 (TreeSketchNet) 将树木的简单草图转换为完整三维模型的中介模型,并基于合成和手工制作的草图对其进行测试,结果表明其结果较为准确。
- 基于聚类和对比的三维点云无监督学习
本文提出了一种名为 ConClu 的通用无监督方法,它通过联合使用点级聚类和实例级对比来实现点和全局特征的学习。实验评估结果表明,该框架在 3D 物体分类和语义分割等下游应用方面具有很好的性能,可以胜过现有技术。
- 具身之手:一体化建模和捕捉手和身体
本研究提出了一种全新的手部模型(MANO),并使用 MANO 模型,结合标准化的人体三维模型(SMPL)构建了一个全身可动态捕捉的模型(SMPL+H),实现了复杂的人体动作捕捉并保持高度真实性。
- CVPRJoinABLe: 学习参数化 CAD 接头的自底向上装配
该研究介绍了一种名为 JoinABLe 的基于学习的装配方法,使用 CAD 文件中的弱监督信息(无需对象类标签或人工指导)组装零件,并通过对实体模型的图形表示进行网络预测,精度(79.53%)接近于人类表现(80%), 并发布了 Fusio - 通过观看视频学习可变形三维物体的 DOVE 模型
DOVE 是一种用于从单目视频中学习可变形物体纹理 3D 模型的方法,无需关键点、视点或模板形状监督,并利用视频中的时间对应关系和对称性消除姿态歧义,将三维形状、艺术姿势和纹理从每个单独的 RGB 帧中分离出来。
- ECCVGeLaTO: 生成潜在的纹理物体
该研究提出了一种名为 GeLaTO 的紧凑表示法,它结合了描述低频几何的一组粗略形状代理和学习的神经纹理,以编码介质和细尺度几何以及视角相关的外观,并应用 U-Net 将代理分别光栅化与对应的神经纹理进行组合,生成具有逼真外观的图像,该方法 - ECCVMask2CAD:通过学习分割和检索实现 3D 形状预测
本文提出了一种基于 CAD 模型的方法,结合现有的大规模三维模型数据集,构建了一种可以检测现实世界图像中物体的 CAD 模型表示方法,并且证明了与现有技术相比,该方法在真实世界图像中有着优势。
- ECCV强化学习建模 3D 形状
本文提出了一种基于深度强化学习的两步神经框架来模拟 Maya 软件中的建模过程,并且采用新颖的训练算法来 efficient 训练模拟器,从而达到模拟生成 3D 模型的效果。
- CVPRLighthouse: 预测具有空间一致性的照明光照体积
本文提出了一种使用深度学习模型对场景的三维模型进行预测,并通过标准体积渲染技术来估算场景中任何三维位置的入射光照强度,可以在没有地面真实三维数据的情况下进行训练,可用于在真实图像中插入高反光虚拟物体的空间变化照明估算方法。
- 2D 到 3D 转换中的点云变形图卷积
本文提出了一种新颖的深度学习方法,通过两个步骤(特征融合和形变)将随机点云变形成对象形状,从而重建单张图像的点云。通过引入一个新层 GraphX,考虑点之间的相互关系,操作无序集合。这个模型还可以生成任意大小的点云,验证了在单图像 3D 重 - 几何感知神经渲染
本文介绍了一种通过 Epipolar Cross Attention 实现的神经渲染方法,可以学习复杂的高维场景的隐式三维模型,提出了三个新的仿真数据集,以展示该方法优于常规方法的定量和定性表现。
- 3DN: 3D 变形网络
3DN 是一个端到端的网络,可以根据 2D 图像、3D 模型或深度扫描获得的点云将源模型形变为目标模型,并使用可微分的操作进行训练来处理具有不同拓扑结构的网格模型,生成比现有基于学习的 3D 形状生成方法更高质量的结果。
- 单张照片生成 3D 角色动画
本文提出单张照片中制作一个可以在三维中行走、奔跑、坐下或者跳跃的角色的方法和应用程序。主要贡献包括三个方面:1)在单张照片中浏览和动画化人类角色的应用程序,2)一种新的二维变形方法,将可摆放的模板人体模型变形以适应人的复杂轮廓,创造可动画的 - ECCV带条件生成对抗网络的成对三维模型生成
本文研究了在生成条件之下如何进行三维模型的生成,并提出了一种新的方法来使得在不同旋转角度下生成的同一模型相同。实验结果表明该方法可以成功地生成不同条件下的模型对。
- 基于深度学习的二值掩模图像人体形状重建
本文提出了一种基于深度学习的方法,通过 2D 正交视图来实现 3D 人体形态的重建,使用二进制掩膜图像即可快速创建数字化人物,并可应用于 3D 游戏、虚拟现实、在线时装购物等领域。
- 多模态几何学习用于抓取和操作
本文提出使用 3D 卷积神经网络结构,融合深度学习和触觉信息来生成可用于机器人操作的丰富准确的三维模型,并通过实验证明,在几何推理方面具有优越性。
- Co-Fusion: 多目标实时分割、跟踪与融合
本文介绍了 Co-Fusion,它是一种密集型 SLAM 系统,使用实时的 RGB-D 图像流作为输入并将场景分割为不同的对象(使用运动或语义线索)同时实时跟踪和重建它们的 3D 形状。我们使用多模型拟合方法,其中每个对象可以独立移动并仍然 - 使用生成对抗网络进行交互式 3D 建模
本文提出利用生成对抗网络(GAN)为新手用户设计真实世界形状,使用具有简单界面的体素网格进行编辑。该方法的主要优势是通过学习投影和生成算子来协助用户创建背景分布对象形状的 3D 模型,同时不必指定所有细节。通过该算法及工具的实验表明 GAN - 从 2D 图像学习动物的 3D 变形
本文提出了一种基于用户标记图片和动物模板的体积变形框架,通过学习每个局部区域的硬度值,动态调整模板三维网格来实现动物变形与模拟,其优于未学习硬度值的方法,适用于高度可形变和关节灵活的动物模型。