- 深度隐式优化用于鲁棒和灵活的图像配准
采用深度学习在图像配准中,该方法结合优化与学习方法,在深度网络中使用优化图层来训练预测多尺度密集特征图像,在特征空间中保证了自学习特征的配准最小值和瓦普函数,并具有良好的性能和通用性。
- ECCV自我监督学习用于来自双重和多重放大观测的实际世界超分辨率
在这篇论文中,我们针对智能手机的参考图像超分辨率(RefSR)处理中的两个挑战性问题进行了研究,即如何选择适当的参考图像和如何以自监督的方式学习 RefSR。同时,我们提出了一种针对真实场景下的 RefSR 的自监督学习方法,通过观察双重和 - 超越已知:对抗自编码器的新颖性检测
通过线性化保持内点分布结构的流形,我们计算新颖性概率,并在网络的训练协议上进行改进,证明我们的方法在学习目标类别方面是有效的,并在几个基准数据集上优于最新的先进方法。
- 深层擦除:用于通用文本消除的深度迭代上下文挖掘
通过迭代操作来擦除图像中的文本,并引入了创新的擦除模块和自定义掩码生成策略,实现了具有强大通用性的 DeepEraser。
- 基于事件的运动放大
提出了一种由事件相机和传统 RGB 相机组成的双摄像头系统,结合了事件流的时间密集信息和 RGB 图像的空间密集数据,以实现对高频运动的广泛和经济有效的放大,通过深度网络解决了高频运动和微小运动放大的问题。
- 基于 UWB 多静态无线电的非设备式人体状态估计
利用低成本的 Ultra-Wide Band(UWB)传感器和深度学习网络,我们提出了一个人类状态估计框架,能够在室内环境中无需特定设备的情况下估计人的位置和活动,实现精确的定位和活动识别。
- 深度网络线性区域的训练动态
在这项研究中,我们研究了连续分段仿射深度网络(如带有(渗漏的)ReLU 非线性的网络)训练动态的输入空间划分或线性区域,提出了一种包含了本地复杂性的新统计量,观察到在训练过程中,数据点周围的本地复杂性经历了几个阶段,与深度网络的记忆性和概括 - LineMarkNet:代客泊车的线路标记检测
通过设计轻量级模组,提出了一种用于自动驾驶中的准确高效线路地标检测系统,该系统能够有效检测停车服务中的线路地标,并应用于 Qualcomm 820A 平台的实时检测。
- 欧氏空间和嵌入空间中基于边界感知的点聚类方法用于屋顶平面分割
通过使用多任务深度网络在欧几里德空间和嵌入空间中构建的点聚类方法来解决屋顶平面分割中边界问题,并构建了合成数据集和真实数据集验证了该方法的显著优越性。
- 使用方向边界框进行物体检测的环境条件评估,用于增强现实应用
该研究提出了一种新的方法,使用定向边界框与深度识别网络来改善增强现实中场景分析和物体识别的性能和处理时间,该方法使用 DOTA 数据集和一个模拟不同环境、照明和获取条件的合成数据集进行评估,结果表明该方法在大多数测试条件下能够更好地识别小物 - 用 MEMS 超声波传感器进行手势估计
提出了一种便携低成本的手部跟踪手套,采用多个微机电系统超声波传感器测量手指之间的距离矩阵,再利用轻量级深度网络从距离矩阵中重建出手部姿态,该方法精度高、尺寸不变且对外部干扰具有鲁棒性。
- 使用文本描述进行图像的多模态着色
该研究提出了一种基于深度网络和文字描述的图像上色方法,通过对象分割和融合模型实现对包含不同颜色物体的真实场景的颜色一致性上色,性能指标优于现有的上色技术。
- Ada-MoDL:将基于模型的深度学习适应于多种获取条件
此研究介绍了一种针对不同磁场强度、加速和对比度等多种采集条件的 MRI 数据的单一基于模型的深度神经网络,可提供高质量的重建。通过使用一个可滚动的体系结构,基于每个捕获条件调整 CNN 特征和正则化参数的权重,利用来自多个采集条件的数据共同 - 视频压缩感知的分层交互重建网络
本文提出了一种新的 Hierarchical InTeractive Video CS Reconstruction Network(HIT-VCSNet)深度网络图像和视频压缩感知方法,通过空间和时间领域中的深度先验共同提取上下文信息,并 - SepicNet:基于曲线参数推断的三维形状锐边恢复
介绍了一种新的深度网络 SepicNet 用于检测和参数化 3D 物体的棱角,包括一种自适应点云采样技术,通过大规模数据集的实验表明该方法的边缘检测效果优于现有技术。
- 异质标签分布下,联邦医学关系抽取中主分类向量的对比研究
本文提出了一种称为 FedCMC 的方法,可以在不泄露原始数据、提取的表示和标签分布的情况下,仅通过转移分类器参数的少量附加传输,使多个客户端协同训练深度网络,其中使用了所提出的新概念 “Major Classifier Vectors” - CVPR捆绑调整神经辐射场的局部到全局配准
本文提出了一种基于像素灵活对齐以及帧级约束参数对齐的局部到全局检测方法 L2G-NeRF,该方法能够成功解决通过细节学习的 3D 表示及相机对齐的约束因素对神经辐射场的应用所带来的巨大限制。
- 网络类型与逻辑回归的相关性
本文通过分析深度神经网络中的 logits 向量,提出一种网络分类器,并找到在使用未标准化的 logits 向量的情况下,随机初始化的网络的预测准确度更高。
- 一种用于维度估计的加性自编码器
本文针对降维问题提出并分析了一种由序列化偏差估计、线性趋势估计和非线性残差估计组成的增量自编码器。实验结果表明,仅通过浅层网络封装非线性行为的自编码器能够识别具有低自编码误差的数据集的内在维度。该研究进一步比较了深层和浅层网络结构及其训练方 - ICCV场景理解中的候选提议选择游戏中的 MCTS 算法和优化
本文提出了一种新方法,使用 Monte Carlo Tree Search(MCTS)算法,从生成的建议池中联合选择和优化建议,以最小化对象项,并且在地面平面重建和 3D 房间布局重建应用中得到了很高的性能表现。