BriefGPT.xyz
大模型
Ask
alpha
关键词
vision problems
搜索结果 - 4
Visformer:基于 Transformer 的视觉友好型模型
通过将 Transformer 模型逐步转化为基于卷积的模型,进行经验证实验表明,命名为 Visformer 的新架构比 Transformer 模型和卷积模型在 ImageNet 分类准确性方面表现更佳,尤其是当模型复杂度较低或者训练集较
→
PDF
3 years ago
CVPR
野外环境中的遮挡注释
本文介绍了一种新的大规模、公共的室内场景阴影注释数据集,并用该数据集训练了一种卷积神经网络,以预测图像中每个像素的阴影信息,并在内在图像的应用中展示了我们的数据和网络的价值。
PDF
7 years ago
通用的表征方法:连接人脸、文本、浮游生物和猫品种的丢失环节
通过大型标注数据集和高容量模型的出现,机器视觉系统的性能正迅速提高。然而,与人类视觉系统形成鲜明对比的是,不同的视觉问题仍然需要分别使用不同的模型进行训练。而人类视觉系统学习的是视觉的普遍表示,对于各种视觉问题都能很好地解决,而且几乎不需要
→
PDF
7 years ago
25 年 CNNs:我们能否与人类抽象能力相比?
本文对卷积神经网络在过去 25 年中分类抽象图像的情况进行了研究,比较了 LeNet 和 GoogLeNet 在分类随机生成的图像上的性能,结果表明在解决人类能够轻松解决的视觉问题方面仍有待努力。
PDF
8 years ago
Prev
Next