本文研究图像目标导航问题,提出了一种基于拓扑表示法、语义特征和监督学习算法的解决方案,在视觉和物理仿真实验中部署该算法,与现有方法相比,在长时间任务中呈现出 50%以上的相对提高。
May, 2020
本文提出了一种可以适应不同场景的视觉定位方法,包括改进的模型架构、层次相关层和尺度和不确定性信息的利用。该方法优于使用 SIFT 特征的 5 点算法和之前训练在不同数据上的学习方法,并在只有很少的参考图像可用的情况下,明显优于现有的学习和经典方法。
Nov, 2020
本文以深度预训练神经网络为基础,探究如何通过数据恢复技术以及自主生成的语义与多样性丰富的合成数据,实现在保护隐私,避免偏见等现实场景下,无需使用原始训练数据进行神经结构搜索的可行性和效果,并发现合成数据的神经结构搜索表现不亚于以往使用原始数据的搜索结果。
Dec, 2021
该研究提出了一种基于卷积神经网络(CNN)的后验概率密度的学习比较方法,可以更准确地进行物体的 6D 位姿估计。经过实验证明,相比于现有技术,在不同场景下且包括不同形状和外观的 11 个物体的多个数据集中,具有显著的性能提升。
Aug, 2015
研究如何从 1 或多张图像中合成逼真的室内 3D 场景,采用了基于图像的 GAN 来直接映射成高分辨率的 RGB-D 图像,及在 VLN 训练中进行空间干扰以提高成功率。
Apr, 2022
本文提出将新视角合成应用于机器人重定位问题,通过 NeRF 类算法所渲染的额外合成数据集,从内部表示的三维场景几何形态中选择虚拟相机位置,进一步改进了姿态回归器的定位精度,结果大幅降低了 Cambridge 地标和 7 景数据集的误差,并将精度与基于结构的方法相媲美,无需架构修改或领域适应性约束,因为该方法允许几乎无限产生训练数据,我们调查了在公共基准数据集上进行训练所使用的数据大小和分布对相机姿态回归的限制,得出结论,姿态回归精度在很大程度上受到相对较小且有偏的数据集的限制,而非姿态回归模型解决本地化任务的能力。同时,采用合成的逼真且具有几何一致性的图像进行数据增强。
Oct, 2021
本文提出了一种新的基于机器学习的方法用于从稀疏的视角图像中合成新的视角图像,该方法使用了两个 CNN 来分别对视差和颜色进行估计,并通过最小化合成图像与标准图像之间的误差来同时训练两个网络。实验结果表明该方法能够合成出高质量的图像并优于现有的技术,该方法可以潜在地降低消费者光场相机所需的角度分辨率,从而提高空间分辨率。
Sep, 2016
本文提出了一种新颖的深度神经网络架构,其可直接从像素级数据对图像进行新视图综合,并通过端到端的训练实现。与传统的多阶段处理方法不同,该系统具有广泛适用性和高质量的结果,是深度学习应用于真实自然图像综合的首例研究。
Jun, 2015
使用能量耗散网络在深度学习中提出了迭代计算下降方向以实现图像重构、特别是对噪声图像进行去模糊,超分辨率和医学图像中来实现。经实验证明,它可以控制网络在推断时遵循数据形成模型,并且它在单幅图像超分辨率和计算机成像重构上取得了良好效果,并进一步扩展到凸可行性问题。
Apr, 2019
通过将原始图像的视图不变外观特征和合成图像的视图依赖空间 - 语义特征相结合,利用图神经网络进行压缩学习和识别,该方法在一个包含多个未见过视觉的交叉视图自定位数据集中得到了验证。
Oct, 2023