BriefGPT.xyz
Ask
alpha
关键词
dense annotations
搜索结果 - 3
基于多粒度跨模态对齐的开放词汇语义分割学习
提出了一种多粒度跨模态对齐 (MGCA) 框架,通过在像素级、对象级和区域级学习对齐来解决现有方法在像素级预测和训练时的粒度差异问题,并采用硬采样策略促进精细的跨模态对比学习,进一步开发自适应语义单元来改善像素预测单元在下游分割中的缺陷。在
→
PDF
4 months ago
视觉对话的大规模预训练:一个简单的最先进基准线
本文提出了一种基于 ViLBERT 的方法,该方法采用与 Visual Dialog 相关的视觉语言数据集的预训练,随后转移到 Visual Dialog 的训练上。文中还发现,在 Visual Dialog 中使用密集注释进行微调,可以提
→
PDF
5 years ago
从稀疏标注的视频学习时态姿态估计
通过对稀疏标注的训练视频进行 PoseWarper 网络训练,提出了一种减少需要稠密注释的方法,并借助变形卷积来隐式学习姿态变形,从而在全视频范围内生成姿态注释,并可能改善姿态估计的准确性。
PDF
5 years ago
Prev
Next