BriefGPT.xyz
Ask
alpha
关键词
pretrained vision transformer
搜索结果 - 3
UnSegGNet: 无监督图神经网络图像分割
利用预训练视觉转换模型提取输入图像的高级特征,然后利用图神经网络和基于模块性的优化准则,无需依赖预先标记的训练数据,从图像中提取和划分有意义的边界,实现了竞争性能,进而对无监督医学图像和计算机视觉领域做出了贡献。
PDF
2 months ago
切割与检测:使用大型基础视频理解模型对切割未修剪视频进行人类跌倒检测
基于大型视频理解模型,本研究探讨了在未修剪视频中进行人类跌倒检测的性能,并利用预训练的视觉变换器进行多类别动作检测,包括 “跌倒”、“躺下” 和 “其他 / 日常活动”。方法中介绍了一种基于未修剪视频简单截取的时间动作定位方法,并引入了简单
→
PDF
5 months ago
AnyOKP: 单次和实例感知的预训练 ViT 目标关键点提取
通过利用预训练视觉转换器(ViT)的强大表示能力,我们提出了一种针对灵活的以物体为中心的视觉感知的一次性实例感知对象关键点提取方法(AnyOKP),并可以在学习支持图像后,为任意类别的多个对象实例获得关键点。我们直接部署现成的预训练 ViT
→
PDF
10 months ago
Prev
Next