- DC-Gaussian: 改进的三维高斯化雨点算法用于反射式车载行车记录仪视频
基于最近的实时神经渲染技术 3D 高斯碎片化,我们提出了 DC-Gaussian 方法,用于从车载行车记录仪视频中生成新的视角。实验证明,我们的方法在新视角合成方面不仅取得了最先进的性能,还能准确重建捕获的场景,并消除遮挡物。
- 具有生成 - 判别表征的遮蔽脸识别
我们提出了一个统一的深度网络来学习生成 - 判别式表示,以便于识别遮挡脸部。我们的方法在合成的遮挡脸部上进行了模块化的预训练,并利用生成编码器和判别改良者来提供鲁棒、判别的表示。通过实验验证了我们方法在识别遮挡脸部上的有效性。
- 用于鲁棒抗遮挡多目标跟踪的近似动态规划框架
研究工作中,我们考虑了涉及多目标跟踪(MOT)的数据关联问题,特别是解决了物体遮挡带来的挑战。我们提出了一个名为近似动态规划跟踪(ADPTrack)的框架,它将动态规划原理应用于改进已有的基本启发式方法。在 MOT17 视频数据集上的测试中 - 冰球中的多人追踪与投影
本研究提出了一种将多目标跟踪问题转化为双边图匹配的新方法,通过将球员的足部关节点映射到顶视冰场模板,并将这些投影位置编码到图网络中,实现对遮挡和重叠球员的可靠空间上下文,从而提高了广播冰球数据集中的 IDsw 和 IDF1 指标。
- RemoCap: 动作捕捉的解缠表示学习
RemoCap 使用空间解缠和动作解缠方法以解决复杂遮挡对 3D 人体重建造成的困难,实现溢出物体区域的准确捕获并重建遮挡的部分。
- CVPR带遮挡的 3D 人体姿态估计:介绍 BlendMimic3D 数据集和 GCN 优化
在 3D 人体姿势估计领域中,准确估计人体姿势,特别是在存在遮挡的情况下,是一个重要挑战。本研究通过填补当前 3D 人体姿势估计技术的不足之处,即缺乏处理遮挡数据和策略,引入了新颖的 BlendMimic3D 数据集,设计用于模拟真实世界中 - CMU-Flownet:在遮挡场景中探索点云场景流估计
在 LiDAR 数据中,遮挡对点云帧对齐造成了困扰,而现有的场景流模型主要在无遮挡的数据集上测试,未能充分解决这一挑战。为了应对这些问题,我们提出了一个新的方法 ——Correlation Matrix Upsampling Flownet - 潜在嵌入聚类算法用于鲁棒性遮挡下的头部姿态估计
本文提出了一个新颖而高效的框架,通过无监督的潜在嵌入聚类与回归和分类组件来优化遮挡和非遮挡图像的潜在特征表示,并改善细粒度角度预测,在野外头部姿势数据集上得到了与最先进方法相当的竞争性能,并具有显著的数据减少优势。我们观察到遮挡头部姿势估计 - CVPRWALT3D: 从时间序列图像生成逼真的训练数据用于重构遮挡下的动态物体
该研究提出了一种新的框架,通过利用自由获得的延时摄影图像来自动生成大规模真实的动态物体遮挡数据集,并通过伪地面实现有效的物体重建方法的训练,取得了在 2D 和 3D 重建方面显著改进的成果。
- 填写 ____ (基于扩散的图像修复流程)
图像修复是将图像中的缺失或故意遮挡部分恢复出来的过程,在现代修复技术中,我们提供了当前主要方法的概述和评估,并着重解决了现有模型在生成过程中缺乏提示和控制能力的问题,并提供了多种实现该功能的方法。最终,通过对生成的高质量图像进行定性检查,我 - 抗遮挡的三维人体姿势估计
通过使用空时图形来表示变形的人体,并引入一个细化网络,该网络在此图形上执行图形卷积以输出 3D 姿势,以确保对遮挡鲁棒性,通过使用一组二进制掩码训练此网络,并模拟某些关节在一段时间内可隐藏,并训练网络对此免疫,证明了该方法相对于从单摄像机序 - 动态补丁感知增强变换器用于遮挡人物再识别
人物重新识别中针对遮挡问题,提出了一种创新的端到端解决方案,名为动态 Patch 感知增强变换器 (DPEFormer)。通过动态选择关键区域和实现更真实的遮挡增强,该模型在遮挡和整体重新识别基准测试中取得了显著的进展。
- 用学习增强的点表示学习鲁棒且具有普适性的辐射场与可见性特征
提出了一种新型的泛化神经辐射场(NeRF)范式,通过基于点而非基于图像的渲染构建了可泛化的神经场,称之为可泛化神经点场(GPF)。该模型通过显式建模可见性并将其与神经特征相结合,提出了一种非均匀取样策略以提高渲染速度和重构质量,并利用特征增 - 使用大型重建模型进行单视角三维人体数字化
利用 Human-LRM 模型,我们可以从一张单一图像中预测人类神经辐射场。通过使用包含 3D 扫描和多视角捕获的大型数据集进行训练,我们的方法展现出了惊人的适应性。此外,为了增强模型在野外场景(尤其是存在遮挡情况下)中的适用性,我们提出了 - YOIO: 光流估计中仅迭代一次的方法,通过挖掘和融合多个必要的全局信息
通过充分利用帧对提供的时空信息,设计回路判断算法以确保获得正确的全局参考信息,并从中挖掘多种必要的全局信息,再设计一个高效的细化模块来融合这些全局信息,提出了一种名为 YOIO 的框架,可以在只进行一次迭代的情况下显著提升遮挡区域的光流估计 - 推广单视角三维形状检索方法解决遮挡和未见物体问题
该研究使用单视角三维形状检索,通过系统性评估考察了目标 3D 形状数据库中的物体遮挡、未见过的 3D 形状数据以及输入图像中的未见过的物体对性能的影响,并提出了合成数据集生成流程。实验结果表明,通过在具有遮挡的合成数据集上进行预训练,然后在 - TEMP3D: 出现遮挡的连续时间 3D 人体姿势估计
在具有重度遮挡的视频序列中,通过使用人体运动先验、大规模预训练的三维姿势和自监督学习,借助于时间连续性的潜力,提高给定视频序列中的三维姿势估计,从而在包含遮挡的自然环境视频中得到连续的三维姿势估计。
- PACE:杂乱环境下的姿态注释
在计算机视觉中,姿势估计是一项关键任务,其目的是在图像或视频中跟踪和操作物体。然而,在姿势估计领域,存在缺乏专注于具有遮挡的杂乱场景的大规模数据集的问题。为了解决这个问题,我们引入了 PACE(杂乱环境中的姿势注释),这是一个大规模基准,旨 - 稠密光学跟踪:连接数据点
本文介绍了 DOT,一种新颖、简单且高效的方法,用于解决点追踪中存在的遮挡问题,并且通过最近邻插值计算粗糙的初始估计密集流场和可见性掩码,然后利用可学习的光流估计器对其进行精细化处理。实验证明 DOT 相较于当前的光流技术更加准确,在速度方 - MD-Splatting:在高度可变形的场景中从 4D 高斯函数中学习度量变形
准确的 3D 跟踪可以在机器人技术、增强现实和生成式人工智能方面推动新的应用。本研究引入了 MD-Splatting,一种用于在高度可变形场景中进行同时 3D 跟踪和新视角合成的方法。它通过学习一种变形函数来实现高质量的 3D 跟踪,并通过