关键词test-time optimization
搜索结果 - 13
- 学习 3D 高斯函数对极度稀疏视图的锥束 CT 重建
通过稀疏视图重建减少辐射剂量的研究方向中,我们提出了一种新的重建框架,名为 DIF-Gaussian,利用三维高斯函数在三维空间中表示特征分布,通过测试时优化改进模型的泛化能力,通过在两个公共数据集上的评估结果,显示出明显优于最先进方法的重 - MEDeA:多视图高效深度调整
该论文提出了一种高效的多视图测试时间深度调整方法 MEDeA,相比于现有的测试时间方法,它的处理速度快了一个数量级。通过利用 RGB 帧和相机参数,MEDeA 预测初始深度图,通过优化局部缩放系数来调整它们,并输出具有时间一致性的深度图。与 - 通用神经人体渲染器
我们提出了一种学习通用神经人体渲染器(GNH)的挑战性方法,该方法可从单目视频中呈现可动人体,在没有任何测试时间优化的情况下,通过利用显式的身体先验和多视图几何将外观信息从输入视频传输到输出图像平面。我们的 GNH 通过三阶段的过程实现了非 - 高效稳健的全局追踪
我们提出了一种新颖的测试时优化方法,可高效且鲁棒地跟踪视频中的任何像素。通过引入一种新颖的可逆形变网络 CaDeX ++,我们改进了效率和鲁棒性,并在架构设计中增加了更强的几何偏差,并利用视觉基础模型提供的归纳偏差。我们的系统利用单目深度估 - RetiGen:利用多视场眼底图像进行广义视网膜诊断的框架
该研究介绍了一种用于增强医学图像领域普适性的新框架,特别关注于利用未标记的多视角彩色底片照片。与依赖单视图成像数据且在不同临床场景中通用性有挑战的传统方法不同,我们的方法利用未标记的多视角成像数据中的丰富信息来提高模型的稳健性和准确性。通过 - SHAP-EDITOR: 指导的潜在三维编辑技术,秒级完成
我们提出了一种新颖的前馈 3D 编辑框架,名为 Shap-Editor,通过利用 2D 图像编辑网络的蒸馏过程,结合适当的潜在空间进行直接的 3D 编辑,构建了一个仅需约一秒编辑时间的前馈编辑网络。
- ConVRT: 在测试时间优化神经视频表征间通过湍流的连贯视频修复
通过在 CLIP 潜空间中优化自监督方法 ConVRT,结合真实世界湍流条件下的训练模型,提供了一个有效的解决方案来减轻动态视频中的大气湍流挑战。
- 多体神经场景流
我们展示了通过鼓励刚体流预测的等距性来实现多体刚性,从而在维持连续流场的同时允许通过一系列点云进行稠密的长期场景流积分。
- ICCVFrozenRecon:基于冻结深度模型的无姿态三维场景重建
我们提出了一种新的测试时间优化方法,可以将仿射不变深度模型的健壮性转移到具有挑战性的多样化场景,同时确保帧间一致性,每个视频帧只需优化几十个参数。实验证明,我们的方法在五个零样本测试数据集上实现了最先进的跨数据集重建。
- 全面实时追踪万物
我们提出了一种新的测试时间优化方法,用于从视频序列中估计密集和长程运动。该方法使用全局一致的运动表示法,并在局部和规范空间之间使用双向对应实现像素级跟踪,能够确保全局一致性,跟踪通过遮挡的像素,并模拟相机和物体运动的任意组合。
- 形状之道:针对不同体型精确三维形状估计
本文提出了 Shape of You (SoY) 方法,旨在提高基于视觉的服装推荐系统中 3D 人体形状估计的精度。我们提出了两种损失函数和一种测试时间优化程序,可以轻松集成到参数化 3D 人体重建管道中,并在具有挑战性的 SSP-3D 数 - 自动驾驶场景流的激光雷达重新评估
通过应用 ICP 运动补偿和分段刚性假设约束,结合测试时间优化方法,自监督 LiDAR 场景流估计技术可以更加有效地解决主要挑战,而不需要训练数据,提升了真实数据上的性能。
- 优化密集检索的测试时查询表示
本篇论文介绍了 TouR 方法,它可以通过测试时间的检索结果来进一步优化基于实例级别的查询表示,从而提高密集检索和开放域问答的性能。