Aug, 2023

借助更先进的集群可能在亚人类尺度上实现图像识别的程度

TL;DR本研究旨在确定目前可用的自监督学习技术是否能够在人们从中获取的相同程度和数量的感官输入下,实现对视觉图像的人类水平理解。研究发现,在同时增加数据量和图像质量的情况下进行规模化实验,可以在亚人类尺寸下实现人类水平的物品检测性能。使用最多 200000 张高达 256 像素每英寸的图像对视觉转换器进行了规模化实验。