- VideoReTalking: 野外环境中基于音频的人工合成视频嘴型同步技术
VideoReTalking 提供一种新的编辑现实中的人物对话视频的系统来生成高质量的、与输入音频同步的视频,其中包括三个连续的步骤:生成具有规范表情的面部视频、音频驱动的口型同步和面部增强。该系统可以处理所有三个步骤,且不需要任何用户干预 - CVPR利用 Pocoformer 的极化彩色图像去噪
本文提出了基于学习的方法来同时恢复清晰的信号和精确的极化信息,一个基于视觉 Transformer 的混合 Transformer 模型被提出以进行极化彩色图像去噪,实验表明该方法的有效性并分析了影响结果的关键因素。
- KDD基于深度学习和对比聚类的行作物路径点生成
本研究提出了一种基于学习的方法,针对行作物的路径生成问题,通过对区域地图的聚类方法,生成导航路径指向航路点,验证结果表明该方法可以高效地解决路径生成问题并超越之前的模型。
- IJCAI学习组装几何形状
这篇研究论文提出了一种基于学习的方法,用于解决组装任意形状的无纹理碎片的问题,并展示了该方法在不同情境下的有效性。
- S3E-GNN:利用图神经网络的稀疏空间情景嵌入进行相机重定位
本文提出了一种名为 “稀疏空间场景嵌入以图神经网络为主体的学习方法(S3E-GNN)” 的端到端框架,用于相机重定位。该方法使用编码模块和查询模块,将场景图嵌入到参考图中进行相机重定位。实验结果表明,由于基于学习的嵌入和 GNN 增强的场景 - CVPR3D 角色次要动作深度仿真
本文提出了一种基于学习的方法,用于增强基于绑定的 3D 角色动画的生动的次要动作效果,通过设计用于编码角色动力学的神经网络,该网络可以预测出新的顶点位置。我们的方法可以高效且精确地模拟角色动态,并且在各种 3D 角色网格和复杂动作序列上得到 - 野外自监督网格预测
该论文提出了一种从单张图像中推断物体的 3D 形状和姿态的学习方法,利用无定型图像集的分割输出进行监督,并采用体素表示和网格化表示相结合的方式进行形状 - 姿态分解和实例重建。
- MM-Hand: 3D 感知的多模式导向的手部生成网络用于 3D 手势合成
该论文提出了一种学习为基础的方法,使用 3D 姿态信息来合成逼真、多样和保留 3D 姿态的手图像,并通过基于几何的课程学习策略使增强数据能够持续提高最先进的 3D 手位姿估计器的定量性能。
- 看见不可见:为房间导航学习语义图
使用学习方法,结合语义地图进行室内导航,预测超出视野范围的置信度地图和目标点,模型可根据建筑模式和风格规律在新环境中进行导航,将房间导航任务简化为点导航可提高性能。
- CVPR学习解析人造环境图像中的线框
本文提出了一种基于学习的方法,用于自动提取混乱人造环境图像的线框表示,并构建了一个非常大的新数据集,并提出了两个适用于提取接头和直线的卷积神经网络,取得了明显优于现有方法的性能。
- CVPR自动对焦学习
利用深度分类模型和序数回归损失优化学习自动对焦技术,相比之前的方法可以将平均绝对误差降低 3.6 倍。
- CVPR单张图片生成 3D 面部肖像
本文提供一种基于学习的方法来从单个肖像图像中恢复人头的 3D 几何形状,并且使用参数化 3D 人脸模型来表示头部几何形状以及其他头部区域的深度图,同时使用双目立体匹配方法从具有野外人脸的图像中学习头发和耳朵的几何信息,最后,评估和对比结果表 - 使用深度强化学习进行芯片布局
本文提出了一种基于学习的芯片布局方法,使用强化学习将芯片画布上芯片网络节点的摆放视作问题,并训练代理人生成以往未见芯片块的优化布局,最终旨在最小化能耗、性能与面积(PPA)。实验结果表明,该方法可在 6 小时内生成可与人工专家相媲美的布局。
- 深度几何函数映射:形状对应的鲁棒特征学习
提出了一种基于学习的方法,用于计算非刚性三维形状之间的对应关系。该方法利用从原始形状几何中直接学习的特征提取网络,结合一种基于功能映射表示的正则化地图提取层和损失函数,能够从比现有的监督方法少的训练数据中学习,并且比当前基于描述符学习的方法 - PointVoteNet: 点云中准确的物体检测和 6 自由度位姿估计
本文提出了一种基于学习的方法,用于在点云数据中完成刚性物体的 6 自由度姿态估计,并且相比于使用 RGB 信息进行物体检测的方法,本方法可以通过初始检测到最终转换估计阶段处理无序的点集来实现准确的姿态估计,有些情况下还能够超过在相同数据上训 - AlignNet-3D: 部分观测对象快速点云配准
本文提出了一种基于学习的方法,旨在精确地估计部分被观测对象的三维运动状态,并使用噪声三维点云进行运动估计。该方法比全局三维注册方法表现更优,且更为高效。
- ICCV单张 RGB 图像的 3D 多人姿态估计之基于相机距离的自顶向下方法
本文提出了一种全面的基于学习的、视野距离感知的自顶向下的方法,用于从单个 RGB 图像中估计多人的 3D 姿态,并通过人体检测、3D 人体根位置定位和相对根姿态估计模块,实现了与最先进单人 3D 姿态估计模型可相媲美的结果,同时也比公开数据 - 可微高斯过程运动规划
通过学习方式自适应高斯过程运动规划算法参数的有效性研究
- 神经体积:从图像中学习动态可渲染的体积
通过学习,我们提出了一种表示动态物体的方法,该方法由编码器 - 解码器网络和可微分的射线行进操作组成,它不需要明确重建或跟踪物体,使用了 3D 体积表示法,表现出更好的图像质量,为高分辨率应用提供了一种从表面到体积的方法
- You2Me: 通过第一和第二人称交互推断自我中心视频中的身体姿态
本文提出了一种基于学习的方法,通过与另一个人的互动来估计身穿相机人的三维身体姿态,演示了我们的想法在多个领域的相关应用和视频实现。