- 具有模态提示的时间自适应 RGBT 跟踪
提出了一种新型的时域自适应 RGBT 跟踪框架 TATrack,该框架通过在线更新模板和跨模式交互,综合利用时空信息和多模态信息进行目标定位,并在三个常用 RGBT 跟踪基准上取得了最先进的性能。
- CVPRFastInst:一种简单的基于查询的实时实例分割模型
本文研究实例分割中的基于查询的模型,并介绍了一种名为 FastInst 的简单且有效的查询框架,它可以在超过 40AP 的同时以实时速度执行(即 32.5 FPS)
- MMDilatedSegNet: 一种用于息肉分割的深度扩张分割网络
该研究论文利用深度学习技术提出一种新颖的实时结构化模型 ——DilatedSegNet,可用于肠镜检查中息肉分割,其平均 dice coefficient 为 0.90,mIoU 为 0.83,其结果表明该模型具有以实现实时反馈为主导且保留 - FOF: 单目实时人体重建的傅里叶占用场学习
本文提出了一种新型、强大、高效、灵活的三维表示 —— 傅里叶占用场(FOF),用于单目实时准确的人体重建,并且构建了第一个 30+FPS 高保真实时单目人体重建框架,能够将三维几何体和二维图像之间的鸿沟连结起来。
- FEANet: 基于特征增强的关注网络进行 RGB - 热图图像实时语义分割
本文提出了一种双阶段特征增强注意力网络,用于 RGB-T 语义分割任务,可在保留空间信息的同时提高时间效率,并在城市场景数据集上优于其他 SOTA 的 RGB-T 方法。
- 实时三维手部网格重建中的精准对齐
该论文提出了一种基于三个阶段的新型流程,通过联合阶段、网格阶段和细化阶段,实现准确的手部姿势和形状的 3D 网格重建,从而达到较高的手 - 图像对齐精度和实时性。该流程在基准数据集上具有优越的结果,证明了其高质量的手 - 网格 / 姿态预测 - ICCVHiFT:用于航拍跟踪的分层特征变换器
本文提出了一种基于 Siamese 的跟踪方法,采用分层特征变换对多级卷积层生成的分层相似度图进行交互式融合,提高了全局的上下文信息,更高效地学习多级特征之间的相互依赖关系,并且实现了在实时速度情况下的实际应用,该方法在四个空中基准测试中被 - 学习时空变换器进行视觉跟踪
本文提出一种新的追踪架构,它以编码 - 解码变压器作为核心组件,将目标追踪转化为直接边界框预测问题,从而实现了端到端模型,无需使用任何先前设定的锚点或提案等后处理步骤。
- EDN: 极度下采样网络在显著目标检测中的应用
本文提出了极端下采样网络(EDN)和尺度相关的金字塔卷积(SCPC)两种技术用于显著性目标检测(SOD)的高层特征学习和多级特征融合,实现了实时速度下的最新最优性能。
- ECCVTP-LSD:基于三点的线段检测器
本研究提出了一种新型的深度卷积模型 TP-LSD,采用三点表示法用于图像线段检测,并通过定义新的评估指标以 Wireframe 和 YorkUrban 数据集为基础,验证其运行速度高达每秒 78 帧,具有竞争性的准确性和结构先验。
- 单目实时体积表演捕捉
本研究通过引入 PIFu 算法和使用表面本地化算法以及在线难例挖掘技术,从而在不需要昂贵的多视图系统或繁琐的预定义模型的情况下,从单眼视频中实时捕捉和渲染了一个完整的实纹三维人体。
- 基于 TridentAlign 和上下文嵌入的视觉跟踪
本篇论文提出了分别基于 TridentAlign 模块和上下文嵌入模块的连体网络视觉跟踪方法以应对高度变化目标对象和类似类别的干扰对象在视觉跟踪中常常面临的挑战,实验结果表明,该跟踪器的性能可与最先进的跟踪器相媲美,同时实现实时速度。
- YOLOv4:目标检测的最优速度和准确度
论文使用多种通用特征,如批量归一化和残差连接以及新增特征,如 Mish 激活功能,实现卷积神经网络的最新成果,在实时速度下达到了 MS COCO 数据集的 43.5% AP(65.7% AP50)。
- CVPR实时视频对象分割的状态感知跟踪器
本研究提出一种新型的 State-Aware Tracker (SAT) 模型来进行半监督视频目标分割。SAT 利用视频属性和目标帧之间的一致性来获得更高的效率,并通过两个反馈循环实现更稳定和鲁棒的表现,获得了在 DAVIS2017-Val - 实时无人机跟踪中的相关滤波增强记忆
本研究提出了一种基于判别相关滤波器框架的新型跟踪器,通过引入历史视图并运行实时速度来拓展记忆,通过快速压缩上下文学习来提高滤波器的鉴别能力,并在 UAVDT 和 UAV123 数据集上验证了该跟踪器的竞争性能。
- ECCV学习盲视频时间一致性
本文利用深度递归神经网络,结合短期、长期以及感知上的损失,为视频处理提供了一种基于帧的将原始视频和处理后的视频作为输入,生成时间上连贯的视频的方法,实现了对多种需求的处理,且无需光流计算,具有实时性能。
- ECCV准确快速物体检测的感受野块网络
本文提出了一种使用手工机制来强化轻量级特征的快速准确检测器,通过在轻量模型特征增强方面受视觉系统中感受野结构的启发,提出了一种新的 RF Block 模块来增强特征的可区分性和鲁棒性,并在 SSD 顶部组装 RFB,构建了 RFB 网络检测 - FaceBoxes: 一个高精度的 CPU 实时人脸检测器
该研究提出了一种名为 FaceBoxes 的新型人脸检测器,其网络结构采用了轻量级但强大的 RDCL 和 MSCL,实现了 CPU 上的实时速度和高性能的检测,同时还具有新的锚定点密集化策略,并在多个人脸检测基准数据集上呈现出最新的检测性能 - 基于深度强化决策的实时视觉跟踪
该研究提出了一种基于深度强化学习方法构建的模板选择策略的实时视觉追踪算法,该算法可有效应对模型更新导致的跟踪偏移问题,可在实时速度下以 43fps 跑动。