- CVPRCLHOP: 马匹 3D 姿态和形状估计的综合音视频学习
通过使用音频来增强从单眼视频中恢复马的 3D 形状和运动的方法,我们在室内跑步机数据集和室外捕获的多样化马运动数据集上测试了我们的方法,并发现将声音与视觉数据结合可以实现更准确和稳定的运动回归。这是第一项研究探讨音频在动物 3D 运动恢复中 - 深度学习模型的双重思维与感知分析使用人类对抗性示例
该研究提出了双重思维框架,通过引入对抗性数据集证明了人类视觉中双重思维的存在,同时研究了深度学习模型的定性行为,并通过使用实例分割模型来解决使用分类模型作为人类视觉计算模型的主要批评。该研究强调了形状在人类视觉中识别实例的重要性,并显示深度 - 超越骨骼:一体化潜像映射的连贯 4D 序列生成
提出了一种新框架,能够根据给定条件下低维空间中的形状和颜色信息的动态演化,生成连贯的 4D 序列。实验证明,该方法在生成具有颜色和 4D 网格动画的高质量 3D 形状方面具有显著优势。
- 物理基于反渲染中的 NeRF 作为非遥远环境发射器
使用 NeRF 作为空间变化的环境光照模型建立反向渲染程序,通过与环境贴图在真实和合成数据集上的比较,展示了使用基于 NeRF 的发射器能更准确地模拟场景光照并导致更精确的反向渲染。
- 风格化辐射场的几何传递
通过使用深度图提取风格指南,然后应用于放射场的几何样式化,本文介绍了一种名为几何传递的新方法,旨在通过几何变形实现三维样式传递,从而增强美学表现力并更准确地反映预期的风格。大量实验证明,几何传递能够实现更广泛、更富有表现力的风格化范围,从而 - SHINOBI: 通过 BRDF 优化进行神经对象分解的形状和光照研究
我们提出了 SHINOBI,一种用于从具有不同照明、姿势和背景的物体图像中重建形状、材料和光照的端到端框架。
- 强化学习中的颜色对形状目标误泛化:一项案例研究
探讨了 Di Langosco 等人在 Procgen Maze 环境中最初展示出的颜色与形状目标错误泛化,即在一个模棱两可的选择中,代理人似乎更喜欢基于颜色而不是形状的泛化。训练了 1000 多个代理并在超过 1000 万个回合中对其进行 - 服装恢复与形状和变形先验
我们提出了一种从现实世界图像中生成逼真服装模型的方法,不论服装的形状或变形如何,该方法利用从合成数据中学习的形状和变形先验准确地捕捉服装的形状和变形,包括较大的变形,并直接应用于动画和模拟等下游应用。
- 基于深度学习算法的核形态测量对犬皮肤鳞状细胞癌具有预后意义
通过深度学习算法的自动形态测量,该研究支持使用自动形态测量作为一种预后测试,以克服估计和手动测量的限制。
- ICCV全球野外三维人体姿态和形状的电磁数据库
我们介绍了 EMDB,全球三维人体姿势和形状的电磁数据库。 EMDB 是一个新颖的数据集,其中包含具有全局身体和相机轨迹的高质量 3D SMPL 姿势和形状参数,用于野外视频。我们使用佩戴在身体上的无线电磁(EM)传感器和手持 iPhone - 理解片段任意模型:SAM 偏向纹理而不是形状
对比人类视觉主要依赖形状来识别物体,深度图像识别模型被广泛认为存在对纹理的偏见。最近,元研究团队发布了首个图像分割基础模型,称为 Segment Anything Model(SAM),这引起了很大的关注。在本研究中,我们从纹理和形状的角度 - ECCV形状、质感和颜色在视觉识别中的贡献
本文研究了人类视觉系统(HVS)的三个重要特征(形状,纹理和颜色)对物体分类的贡献,构建了一个人形视觉引擎(HVE),分别从图像中计算形状,纹理和颜色特征,然后将特征向量连接以支持最终分类,并利用 HVE 总结和排序三个特性对目标识别的贡献 - EMNLPSHAPE: 基于位移的绝对位置编码用于 Transformers
本论文通过随机平移绝对位置来构建 shift invariance 的 position representation SHAPE,其计算效率和性能与其他方法相当且更为简单。
- Point2Mesh: 可变形网格的自学先验
本文提出了 Point2Mesh 技术,它可以从输入的点云重建出表面网格,使用了深度神经网络自动定义先验,并通过优化整个形状的卷积核来实现全局优化以适应整个物体。与传统的重建方法相比,Point2Mesh 对现实世界的非理想条件更具鲁棒性。
- 通过 Trunk-Branch 生成对抗网络合成耦合的三维人脸模态
本研究提出了一种新颖的 GAN 方法,可以联合生成面部纹理、形状和法向量信息,用于进行类真实面部合成。同时,我们展示了如何以面部表情为条件生成具有不同表情的面部。
- AAAI学习可学习深层先验的空间混合模型用于知觉分组
本文提出了一种新的具有可学先验的空间混合模型来实现感知分组。 该方法将对象的属性划分为 “形状” 和 “外观”,并通过神经网络分别建模。 在感知分组数据集上进行的广泛实证测试表明,所提出的方法在大多数实验配置下优于现有的方法。
- CVPR从野外图片中学习 3D 人脸可塑模型
本文提出了一种新的框架以学习从大量野外人脸图像中学习非线性 3DMM 模型,该模型可以用于面部对齐,3D 重建和面部编辑。
- 透明物体的完整三维重建
本文提出了一种用于重建透明物体完整 3D 形状的全自动方法,通过不同视角下捕获透明物体的轮廓和光线折射路径,并在表面投影、轮廓一致性和表面光滑度三个约束条件下逐步优化模型,实验结果表明该方法可以成功恢复透明物体的复杂形状,并忠实地再现它们的 - CVPRSfSNet: 野外人脸形状、反射率和照明学习
SfSNet 是一个人脸图像分解的端到端学习框架,通过混合合成标签和未标记真实世界图像进行学习,可以预测照明,从而实现形状、反射率和光照的精确分解。