BriefGPT.xyz
Ask
alpha
关键词
vision transformer architecture
搜索结果 - 3
CVPR
通过概念发现实现可解释的细粒度哈希
ConceptHash 是一种新颖的方法,通过利用 Vision Transformer 架构和语言引导,实现了对细粒度图像检索任务中哈希码的可解释性,并在四个细粒度图像检索基准上取得了显著优于之前方法的性能。
PDF
24 days ago
IDPL-PFOD2:一个用于印刷波斯文光学字符识别的新的大规模数据集
本文介绍了一种针对波斯文印刷文本识别的新型大规模数据集,该数据集包含 2003541 个图像并提供各种字体、样式和尺寸。通过使用基于 CRNN 和 Vision Transformer 的体系结构来评估数据集的有效性,CRNN-based
→
PDF
7 months ago
使用稀疏部分正确的分割掩模在四肢和滑雪板上检测任意关键点
本文介绍了一种基于视觉转换(Vision Transformer)架构和部分正确分割掩码训练的方法,可检测专业滑雪跳跃者的任意关键点。通过分析不同的训练技巧,实验证明仅需要一些部分正确的分割掩码即可学习检测肢体和滑雪板上的任意关键点,从而可
→
PDF
2 years ago
Prev
Next