Nov, 2024

视觉中的自回归模型:综述

TL;DR本研究针对自回归模型在计算机视觉领域应用的文献进行全面审视,填补了目前在该领域的知识空白。论文提供了一种新颖的分类方法,将视觉自回归模型划分为像素、标记和尺度等三种基本子类别,并探讨了其在图像生成、视频生成、3D生成等多个领域的应用。研究还指出了当前自回归模型在视觉中的挑战,并提出了未来的研究方向。