Muhammad Awais, Muzammal Naseer, Salman Khan, Rao Muhammad Anwer, Hisham Cholakkal...
TL;DR视觉系统、基础模型、环境中的上下文推理、训练目标和计算机视觉的挑战和研究方向的综述。
Abstract
vision systems to see and reason about the compositional nature of visual
scenes are fundamental to understanding our world. The complex relations
between objects and their locations, ambiguities, and variations in the
real-world environment can be better described in human language, n
本文介绍了基础模型,深度学习中通过模型大小和训练数据广度和大小的扩展可以对未来的 AI 开发造成破坏。基础模型在各种任务领域(如自然语言处理和计算机视觉)中实现了最先进的性能,并且通过进一步的改进常常得到更好的表现。此外,模型的单一化可能会将众多特定任务的模型替换为由少数公司控制的更少数量的大型模型,从而导致对 AI 的权力和控制的转移,并出现新兴的行为方式:上下文学习。