- TransTouch:透明物体的深度感知学习与稀疏触摸
通过使用触觉反馈的探测系统自动收集稀疏深度标签并对立体网络进行微调,结合触觉深度监督和基于置信度的正则化以优化深度感知,特别是对于透明物体而言,在真实世界中显著提高了深度感知的准确性。
- RIDE: 内窥镜的自监督学习旋转等变关键点检测和不变描述
基于学习的方法 RIDE 在内窥镜图像中实现了旋转均变的检测和不变描述,无需手动标记训练数据,在匹配和相对位姿估计任务中表现突出,并在手术组织跟踪方面具有竞争力的得分。
- 基于领域信息的高斯过程状态空间模型的区分外分布检测
提出了一种利用现有领域知识嵌入核函数的新方法,以及一种基于滚动预测的离线在线监控器,用于使机器人在未知情况下使用基于学习的方法安全导航。数值结果表明,与标准的核函数选择相比,具有领域知识的核函数在小数据集上具有更好的回归质量。通过对一个室内 - 协作强韧水下图像增强与感知的双重对抗性韧性
本论文介绍了一种协作对抗鲁棒性网络(CARNet),用于水下图像增强和后续检测任务。通过引入具有强大扰动感知能力的可逆网络来隔离水下图像中的攻击,防止对图像增强和感知任务的干扰,并结合视觉驱动和感知驱动攻击的同步训练策略,使网络能够识别和去 - 弱点注释下的领域自适应突触检测
利用基于分割的 AdaSyn 框架和弱点注释,本研究提出了一种用于领域自适应突触检测的两阶段分割方法,通过高质量伪标签改善模型的普适性,成功应用于不同脑区的数据集,并在 ISBI 2023 的 WASPSYN 挑战中获得第一名。
- ICCV基于区域展开变换器的非刚体物体接触估计
通过 RUPs 和 RUFormer 方法,本研究提出了一种新颖的手 - 物体接触表示方法,可以有效地预测非刚性接触中的形变程度和变形转换,适用于刚性和非刚性接触模式。
- DF-3DFace:一对多语音同步的扩散式 3D 面部动画
基于扩散的语音驱动 3D 面部动画综合 DF-3DFace 方法,成功从语音中生成高度可变的面部形状和动作,同时实现比现有技术更逼真的面部动画。
- ICCVFrozenRecon:基于冻结深度模型的无姿态三维场景重建
我们提出了一种新的测试时间优化方法,可以将仿射不变深度模型的健壮性转移到具有挑战性的多样化场景,同时确保帧间一致性,每个视频帧只需优化几十个参数。实验证明,我们的方法在五个零样本测试数据集上实现了最先进的跨数据集重建。
- MMPAIF: 感知感知红外可见光图像融合技术对抗容忍语义分割
提出了一种感知感知融合框架来提高对抗环境中的分割鲁棒性,通过系统分析图像融合的组成部分与对抗扰动下的分割鲁棒性的相关性,并提出一种基于分解结构的协同设计方法来平衡标准准确率和鲁棒性,以及一种自适应学习策略来提高图像融合的参数鲁棒性。实验结果 - ICCV迈向更合理的深度图像配准
本研究论文调查了流行的基于深度学习的图像配准方法的模型行为,并提出了一种基于正规化的新颖的合理性验证方法来减少逆一致性错误并同时增加鉴别能力。通过实验结果支持理论发现,证明了该方法在提高模型合理性方面的有效性。
- 基于 EFO_k 的 CQA:超越集合操作的知识图谱复杂查询响应
为了回答知识图谱上的复杂查询,我们提出了一个综合框架,涵盖了存在性一阶查询的组合空间,并构建了一个 dataset 进行评估。我们的结果揭示了查询难度对结果的影响,并强调了现有数据集构建过程中的系统偏见对查询 - 回答方法的适当发展的重要性 - 回归优化:基于扩散的零样例三维人体姿势估计
通过结合基于优化和基于学习的方法,我们提出了 Zero-shot Diffusion-based Optimization (ZeDO) 管线,用于解决跨领域和野外环境下的 3D 人体姿态估计问题,并在多种数据集上实现了最先进的性能。
- 可扩展动态避障的顺序神经障碍物
基于时序神经控制屏障模型的组合学习方法,在动态障碍物导航方面具有可扩展性和效果优于其他方法的实用性。
- 通过动态自适应提升视频帧插值能力
本文提出了一种基于优化的视频帧插值方法,该方法利用循环一致性自适应策略,结合现有预训练的插值模型中的运动估计模块,以适应测试时的未见过的运动,实现提升性能。经过各种基准测试的详尽实验表明,该方法可以提升两帧插值模型的性能,优于现有最先进的方 - UIERL:水下图像增强的内外表征学习网络
本文提出了一种新的内部 - 外部表示学习(UIERL)网络,通过内部联结和外部信息交互的方式以更好地执行 UIE 任务,解决先前方法中存在的区域质量差异和互相关联的图像之间的信息利用不足的问题。
- 基于双层快速场景适应的低光图像增强
该研究通过统计分析,构建了一种双层学习框架来解决计算机视觉中增强低光场景中的图像的问题,并提出了新的 Retinex 诱导架构。在多个数据集上进行的实验表明,该模型具有良好的适应性和表现优越性。
- 使用 Transformer 学习采样字典,实现机器人运动规划的高效与通用
本论文提出了一种名为矢量量化运动规划转换器(VQ-MPT)的新方法,它克服了以往基于学习的方法的主要限制,包括无法扩展到更高维度空间和缺乏对分布之外环境的通用性,使其能够应用于各种复杂性系统,实现了较高的成功率和更快的路径规划。
- 学习一个卷积层模型以进行低光图像增强
本文介绍了一种在低亮度条件下进行图像增强的轻量级神经网络,提出了全局低光强度增强和局部自适应校正的方法来解决不同图像区域的曝光问题,实验结果表明该方法在客观指标和主观视觉效果方面都表现出色。
- MM基于深度 GEM 网络的弱监督 UWB 距离误差缓解
本文提出了一种基于弱监督的学习框架,采用基于广义期望最大化(GEM)算法的深度学习方法,在弱监督标签的先验信息下对超宽带(UWB)测距误差进行鲁棒处理,实现了从原始数据中利用高语义特征的性能改进。
- 盲图像超分辨率的广义期望最大化框架
本文提出了一种基于学习方法的针对盲目全像单幅图像超分辨率重建的端到端学习框架,该方法将学习技术集成到广义 EM 算法中,通过最大似然估计从低分辨率图像中推断出高分辨率图像,并在半监督学习中具有较高的性能。