- 实际环境中盲超分辨率的端到端交替优化
采用交替优化算法,通过设计卷积神经网络模块 Restorer 和 Estimator,实现了盲超分辨率重建,克服了降解估计准确性不高的问题,从而获得更鲁棒和准确的最终结果。
- 自组织点云
本文提出了自我监督的点排序方法,利用一种新颖的可区分积分和层次对比方案学习点排序,构造了首个端到端可训练的网络,在多个数据集和任务上取得了优于监督排序方法的结果,包括对未见类别点云的零样本排序。
- CVPR3Mformer:多阶多模态 Transformer 用于骨骼动作识别
该研究提出了一种使用超图模型的多阶多模态转换器来识别骨骼动作,并包括更高级别的运动模式及可训练的网络,在骨骼活动识别中优于 GCN、transformer 和超图等现有模型。
- MM遮挡人员再识别的动态原型掩模
本研究提出了一种基于动态原型掩模 (DPM) 的方法,旨在解决人物再辨识领域中由各种障碍物造成的常见遮挡问题,通过 Hierarchical Mask Generator 和 Head Enrich Module 实现自适应对齐和特征空间扩 - CVPR基于场景文本的知识挖掘用于细粒度识别
提出了一种可进行场景文字图像语义挖掘、增强细粒度图像分类表示的端到端可训练网络,其通过三种模态:视觉特征提取、文本语义提取和相关背景知识相结合,利用 KnowBert 检索相关知识来进行语义表示,并在 Con-Text 和 Drink Bo - 盲目超分辨率的端到端交替优化
采用交替优化算法,设计卷积神经模块 Restorer 和 Estimator,将其交替使用,以构建端到端可训练网络。实验结果表明,该方法可以大大优于现有的方法,并以更高的速度产生可视更优的结果。
- CVPR通过联合文本检测和相似性学习实现场景文本检索
本篇论文提出了一种新的场景文本检索方法,使用交叉模态相似性学习直接匹配查询文本和自然图像中每个文本实例之间的相似性,并通过建立端到端可训练的网络来实现场景文本检测和交叉模态相似性学习的联合优化,在三个基准数据集上的实验表明该方法优于现有的场 - CVPR空间中的宽度 - 深度范围 6D 物体姿态估计
本论文提出了一种单阶段的分层端对端可训练网络,可以更好地解决大规模空间场景中的 6D 姿态估计问题,相比现有方法在合成的太空图像和标准数据集上表现更优秀。关键词包括 6D 姿态估计、空间、大气散射、基准数据集和端对端可训练网络
- 盲超分辨率的交替优化展开
该论文提出了一种用于盲超分辨率的交替优化卷积神经网络,包括恢复器和估计器,能够在单个模型中同时估计模糊核和还原超分辨率图像,并利用交替优化的方式达到更好的效果。
- 学习范畴级别 6D 目标姿态和尺寸估计的规范形状空间
本文提出了一种新的方法来进行类别级别的 6D 目标姿态和大小估计,并将 CASS 和姿态估计和大小估计集成到端到端可训练网络中。
- ICCVSNIDER:用于提高车牌识别的单张噪声图像去噪和矫正方法
该论文提出了一种基于卷积神经网络的算法,可用于从低质量图像中识别车牌。作者设计了一个端到端的可训练网络 Single Noisy Image DEnoising and Rectification (SNIDER),将图像去噪和矫正作为一个 - AAAI框架和特征上下文视频超分辨率
本文提出一个全新的基于上下文信息的可训练视频超分辨率网络,结合了局部网络和上下文网络,通过利用多个低分辨率帧中的信息和之前预测的高分辨率帧的特征来保持时域连续性,从而实现高质量视频超分辨率结果的实时生成,结果表明本文方法在准确性、效率和视觉 - ICCVSegFlow: 视频目标分割和光流联合学习
本文提出了一种端到端可训练网络 SegFlow,用于同时预测视频中逐像素对象分割和光流,并通过统一框架双向传播对象分割和光流的有用信息。实验证明,引入光流可提高分割性能,同时改善了最先进算法的结果。
- 细粒度姿态预测、归一化和识别
本文提出了一种全卷积网络的方法,通过部位定位和关键点标注来实现表观的转化,以有效解决姿态变化和外观上的微妙差异在微细分类中的挑战。在 CUB200 测试集中表现出最新的性能,为强监督发挥了重要作用。