BriefGPT.xyz
Ask
alpha
关键词
low-level visual features
搜索结果 - 4
ReViT: 增强视觉变压器的注意力残差连接 用于视觉识别
通过引入新的残差注意力学习方法来改善 Vision Transformer (ViT) 架构,包括增加视觉特征多样性和模型的鲁棒性,以提高识别系统的准确性。在五个图像分类基准测试中,通过对 ImageNet1k、CIFAR10、CIFAR1
→
PDF
5 months ago
CVPR
先于视觉感知:一种压缩视频时序句子对齐的有效管道
本研究针对压缩视频展开了时间句子引导的任务,并提出了一种全新的三分支压缩域空时融合框架(TCSF)来提取和聚合低级视觉特征以有效地进行时间句子引导。实验结果表明,TCSF 较其他最先进的方法具有更好的性能,并具有更低的复杂度。
PDF
a year ago
学习多层深度表示用于图像情感分类
本文提出了一种新的深度网络(MldrNet),可以通过图像语义、图像美学和全局与局部视图的低级视观特征来学习图像情感分类的多级深层表示。实验表明,该方法在分类准确性方面至少优于现有最先进的使用深度特征或手工特征的方法。
PDF
8 years ago
ECCV
使用空间池化特征加强行人检测效果
本研究提出一种简单而有效的行人检测方法,其基于低级视觉特征和空间池化,将部分 ROC 曲线下面积直接优化,表现出色优于当前所有竞争方法,平均错误率最低达到了 11%,与多个基准数据集相比,取得了最先进的结果。
PDF
10 years ago
Prev
Next