- 单目全向俯视图中的人体姿态估计
该研究提出了一个新的数据集(THEODORE+),用于训练和评估卷积神经网络(CNNs)在全景相机中识别人体姿态,以及针对 THEODORE + 数据集的四种重新训练或微调神经网络的训练方法,并在 PoseFES 数据集中取得较明显的改进。
- SiLK -- 简单学习关键点
本文采用学习法重新设计现有的关键点检测器,提出了一种名为 Simple Learned Keypoints (SiLK) 的新方法,其表现优异,并在多项任务中获得了最新的最佳性能。
- CVPR探测三级、高级和长跳运动员身体上的任意关键点
该论文研究了基于视频的运动表现分析,提出了一种基于 Transformer 的方法进行运动员身体姿态的关键点检测。
- CVPR通过联合学习检测和描述关键点来增强可变形局部特征
DALF is a new, deformation-aware network for jointly detecting and describing keypoints, which can be used for local fea - 基于本地 GNN 的深度强化学习用于目标驱动的变形物体重新排列
使用基于 GNN 的学习方法,通过两个表示图对图像中检测到的关键点进行编码。采用自注意力进行图更新和交叉注意力进行生成操作,实验表明该框架在多个 1-D 和 2-D 重排任务中非常有效,并且可以通过微调关键点检测器轻松转移到真实机器人中。
- MM面向高性能的单阶段人体姿态估计
本文针对使用 Mask RCNN 进行人体姿态估计时存在的性能问题及效率问题,提出了一种基于改进后的全局上下文模块和 ResNet-50 骨架的人体姿态估计方法,取得了较好的姿态估计效果和运行效率。
- CVPR自动生成标注数据集的 HandsOff 方法
本文介绍了 HandsOff 框架,它可以在使用不到 50 个已标记图像的情况下训练,生成数量不限的带有标签的合成图像,这个方法绕过了现有方法的实际缺点,同时具有优异的性能表现。
- 使用稀疏部分正确的分割掩模在四肢和滑雪板上检测任意关键点
本文介绍了一种基于视觉转换(Vision Transformer)架构和部分正确分割掩码训练的方法,可检测专业滑雪跳跃者的任意关键点。通过分析不同的训练技巧,实验证明仅需要一些部分正确的分割掩码即可学习检测肢体和滑雪板上的任意关键点,从而可 - 使用合成训练数据实时检测 2D 工具关键点
提出了一种基于深度学习和合成数据的计算机视觉模型,采用先进的渲染技术和中介监督架构来解决合成数据在真实图像上精度下降的问题,模型可应用于不同工具的 2D 关键点检测。
- 基于深度学习的先天性髋关节发育不良自动诊断系统
本研究提出了一种基于深度学习的系统,可以自动从一份放射学报告中检测出 14 个关键点,并测量 3 种解剖角度,从而对髋关节发育不良(DDH)的疾病等级进行分类。通过提出的打分系统,本研究可以为骨科医生提供可靠且可解释的临床决策支持。
- 特征解耦的弱监督高保真超声视频合成
本文提出了一种基于动态内容图像的高保真超声图像视频综合方法,采用自我和全面监督学习,同时采用对偶编码器和 GAN 损失策略,实现了对复杂超声瞬态运动的处理,并在大量临床数据中进行了有效验证。
- 视觉任务的统一序列接口
本文提出一种基于共享像素到序列接口的框架,将计算机视觉中的四种不同任务(对象检测、实例分割、关键点检测和图像字幕)的输出形式都改为序列输出,并且可以通过短提示来实现任务特定的输出,证明可以用单个模型架构和损失函数在这些任务上进行训练,达到与 - ViTPose: 用于人体姿势估计的简单视觉 Transformer 基线模型
本文通过一个名为 ViTPose 的基础模型展示了纯视觉 Transformer 在姿态估计任务中的潜力,该模型结构简单、可扩展、训练方式灵活,并在多关键点检测中取得了优异的性能,其中大模型最高精度达到当前最佳水平。
- CVPR自监督等变学习用于定向关键点检测
本文提出了一种使用旋转卷积神经网络的自监督学习框架,通过生成的图像对和直方图来训练密集方向对准损失,从而学习检测具有鲁棒性的定向关键点,并在图像匹配和相机姿态估计基准测试中表现出优异的性能。
- CVPRUMT: 统一多模态 Transformers 用于联合视频片段检索和亮点检测
本研究提出了一个名为 UMT 的统一多模态转换器的框架,能够实现时刻检索和精华视频检测的联合优化,并且能够轻松地退化为解决单个问题。实验结果表明,该方法在各种设置下都具有有效性、优越性和灵活性。
- AAAISim2Real 基于物体中心的关键点检测与描述
本文提出了一种以物体为中心的检测和描述方法,结合 sim2real 对比学习机制,以及不确定性,完善像素级特征描述,实现物体级别匹配和在聚类环境下的位姿估计,同时得到了良好的推广性能和 6D 姿态估计精度。
- CVPR未见过物种的少样本关键点检测与不确定性学习
本研究提出了一种名为 “FSKD” 的方法,它利用少量标注样本可以对未知物种进行基准点和新关键点的检测。该方法包含主要和辅助基准点表示学习、相似性学习、基准点本地化不确定性建模等步骤,并引入了多元高斯分布来利用邻近基准点之间的隐式相关性。方 - ALIKE:精准且轻量级特征点检测和描述子提取
提出了一种局部可微的关键点检测模块,能够输出精确的亚像素关键点,用于在各种任务中达到与现有最先进方法相当的性能,同时大大减少了推理时间。
- 一份新颖的四足动物关键点检测数据集
本文介绍了使用深度学习模型结合 AwA Pose 数据集识别四足动物关键点的研究成果,该数据集涵盖了较多动物种类及关键点数量,可以帮助计算机视觉领域研究构建更准确的模型。
- ICCV基于特征度量细化的像素完美式结构运动恢复
本文通过直接对多个视图中的低级图像信息进行对齐以提高结构运动两个关键步骤的精度,该方法通过采用神经网络预测的密集特征来优化特征度量误差从而提高了相机姿态和场景几何的准确性。