vision problems | BriefGPT - AI 论文速递

关键词vision problems

搜索结果 - 4

Visformer：基于 Transformer 的视觉友好型模型
通过将 Transformer 模型逐步转化为基于卷积的模型，进行经验证实验表明，命名为 Visformer 的新架构比 Transformer 模型和卷积模型在 ImageNet 分类准确性方面表现更佳，尤其是当模型复杂度较低或者训练集较
PDF3 years ago
CVPR野外环境中的遮挡注释
本文介绍了一种新的大规模、公共的室内场景阴影注释数据集，并用该数据集训练了一种卷积神经网络，以预测图像中每个像素的阴影信息，并在内在图像的应用中展示了我们的数据和网络的价值。
PDF7 years ago
通用的表征方法：连接人脸、文本、浮游生物和猫品种的丢失环节
通过大型标注数据集和高容量模型的出现，机器视觉系统的性能正迅速提高。然而，与人类视觉系统形成鲜明对比的是，不同的视觉问题仍然需要分别使用不同的模型进行训练。而人类视觉系统学习的是视觉的普遍表示，对于各种视觉问题都能很好地解决，而且几乎不需要
PDF7 years ago
25 年 CNNs：我们能否与人类抽象能力相比？
本文对卷积神经网络在过去 25 年中分类抽象图像的情况进行了研究，比较了 LeNet 和 GoogLeNet 在分类随机生成的图像上的性能，结果表明在解决人类能够轻松解决的视觉问题方面仍有待努力。
PDF8 years ago